Context Navigation

← Previous Change
Next Change →

Aggregator.java

Timestamp:

02/26/15 16:17:04 (9 years ago)

Author:

emanuel.dima@uni-tuebingen.de

Message:

alpha 25: removed unused iso-639-2 support and unused german tokenizer; fixed bug related to xml unencoding; changed weblicht config

File:

: 1 edited

SRUAggregator/trunk/src/main/java/eu/clarin/sru/fcs/aggregator/app/Aggregator.java (modified) (9 diffs)

Legend:

: Unmodified
: Added
: Removed

SRUAggregator/trunk/src/main/java/eu/clarin/sru/fcs/aggregator/app/Aggregator.java

-                      r6057
+                      r6065
 import eu.clarin.sru.fcs.aggregator.rest.RestService;
 import eu.clarin.sru.fcs.aggregator.scan.Statistics;
 import eu.clarin.sru.fcs.aggregator.lang.LanguagesISO693_3;
+import eu.clarin.sru.fcs.aggregator.util.LanguagesISO693;
 import io.dropwizard.Application;
 import io.dropwizard.assets.AssetsBundle;
 …
 import java.io.File;
 import java.io.IOException;
-import java.io.InputStream;
 import java.util.ArrayList;
 import java.util.Collections;
 …
 import java.util.concurrent.ScheduledExecutorService;
 import java.util.concurrent.atomic.AtomicReference;
-import opennlp.tools.tokenize.TokenizerModel;
 import org.slf4j.LoggerFactory;
 …
  * @author edima
+ *
+ * TODO: ?use weblicht only to show up in zoomed mode
+ * - send only tcf with only a text layer and language (from the list in params)
+ *
+ * TODO: add the modes described above (except live)
+ *
  * TODO: zoom into the results from a corpus, allow functionality only for
  * the view (search for next set of results)
 …
  * Twan (they did a test, it worked)
+ *
+ * TODO: add PiWik support, tracking the following:
+ * - visits, searches, search per corpus
+ *
+ * TODO: BUG: language detection is immediate, in UI; export implications
+ *
  * TODO: websockets
+ *
 …
         private AtomicReference<Statistics> searchStatsAtom = new AtomicReference<Statistics>(new Statistics());
-        private TokenizerModel tokenizerModel;
         private LanguageDetector languageDetector;
         private TextObjectFactory textObjectFactory;
 …
+                }
+                LanguagesISO693_3.getInstance(); // force init
+                initTokenizer();
+                LanguagesISO693.getInstance(); // force init
                 initLanguageDetector();
 …
+        }
-        public TokenizerModel getTokenizerModel() {
-                return tokenizerModel;
+        }
         private static void shutdownAndAwaitTermination(AggregatorConfiguration.Params params,
                         ThrottledClient sruClient, ExecutorService scheduler) {
 …
+        }
-        private void initTokenizer() {
-                TokenizerModel model = null;
-                try {
-                        try (InputStream tokenizerModelDeAsIS = Thread.currentThread().getContextClassLoader().getResourceAsStream(DE_TOK_MODEL)) {
-                                model = new TokenizerModel(tokenizerModelDeAsIS);
+                        }
-                } catch (IOException ex) {
-                        log.error("Failed to load tokenizer model", ex);
+                }
-                tokenizerModel = model;
+        }
         public void initLanguageDetector() throws IOException {
                 List<LanguageProfile> languageProfiles = new LanguageProfileReader().readAll();

Note: See TracChangeset for help on using the changeset viewer.

Context Navigation

Changeset 6065 for SRUAggregator/trunk/src/main/java/eu/clarin/sru/fcs/aggregator/app/Aggregator.java

Legend:

SRUAggregator/trunk/src/main/java/eu/clarin/sru/fcs/aggregator/app/Aggregator.java

Download in other formats: