Changeset 2107


Ignore:
Timestamp:
08/16/12 14:53:42 (12 years ago)
Author:
zastrow
Message:
 
Location:
SRUAggregator/trunk
Files:
2 added
4 edited

Legend:

Unmodified
Added
Removed
  • SRUAggregator/trunk/nbproject/private/private.xml

    r2097 r2107  
    33    <editor-bookmarks xmlns="http://www.netbeans.org/ns/editor-bookmarks/1"/>
    44    <editor-bookmarks xmlns="http://www.netbeans.org/ns/editor-bookmarks/2" lastBookmarkId="0"/>
    5     <open-files xmlns="http://www.netbeans.org/ns/projectui-open-files/1">
    6         <file>file:/Users/zastrow/Documents/ClarinD/schrauber/Aggregator/trunk/src/java/clarind/fcs/Harvester.java</file>
    7         <file>file:/Users/zastrow/Documents/ClarinD/schrauber/Aggregator/trunk/src/java/clarind/fcs/Aggregator.java</file>
    8         <file>file:/Users/zastrow/Documents/ClarinD/schrauber/Aggregator/trunk/web/index.zul</file>
    9     </open-files>
    105</project-private>
  • SRUAggregator/trunk/src/java/clarind/fcs/Aggregator.java

    r2097 r2107  
    1717import org.zkoss.zul.Separator;
    1818import org.zkoss.zul.Label;
     19import org.zkoss.zul.Comboitem;
    1920
    2021public class Aggregator extends SelectorComposer<Component> {
     
    3031    @Wire
    3132    private Groupbox allCorpora;
     33     @Wire
     34    private Comboitem german;
    3235
    3336    @Override
     
    3538        super.doAfterCompose(comp); //wire variables and event listners
    3639        //do whatever you want (you could access wired variables here)
     40       
     41        languageSelect.setSelectedItem(german);
     42       
    3743        Harvester harv = new Harvester();
    3844        ArrayList<Endpoint> ep = harv.getEndpoints();
     
    4349
    4450            System.out.println("Calling corpora ...: " + ep.get(i).getUrl());
    45             ArrayList<String> corpora = harv.getCorporaOfAnEndpoint(ep.get(i).getUrl());
     51            ArrayList<Corpus> corpora = harv.getCorporaOfAnEndpoint(ep.get(i).getUrl());
    4652
    4753            if (corpora.size() == 0) {
    4854                Checkbox cb = new Checkbox();
     55                 cb.setId(ep.get(i).getUrl() + "?operation=searchRetrieve&version=1.2");
    4956                cb.setLabel(ep.get(i).getUrl());
     57               
    5058                allCorpora.getChildren().add(cb);
    5159                allCorpora.getChildren().add(new Separator());
     
    5765                for (i2 = 0; i2 < corpora.size(); i2++) {
    5866                    Checkbox cb = new Checkbox();
    59                     cb.setLabel(corpora.get(i2));
     67                   
     68                    //http://clarinws.informatik.uni-leipzig.de:8080/CQL?operation=searchRetrieve&version=1.2&query=Boppard&x-context=11858/00-229C-0000-0003-174F-D&maximumRecords=2
     69
     70                    cb.setId(ep.get(i).getUrl() + "?operation=searchRetrieve&version=1.2&x-context=" + corpora.get(i2).getValue());
     71                    cb.setLabel(corpora.get(i2).getDisplayTerm());
    6072                   
    6173                    allCorpora.getChildren().add(cb);
     
    7789    public void onExecuteSearch(Event ev) {
    7890        try {
     91           
     92            if (languageSelect.getText().trim().equals("")){
     93                  Messagebox.show("Please select a language.");
     94                  return;
     95            }
     96           
    7997            String display = "SearchString: " + searchString.getText() + "\n";
    8098
     
    92110                    if (cb.isChecked()) {
    93111                        // now execute the search:
    94                         display = display + cb.getLabel() + "\n";
     112                        String query = cb.getId() + "&maximumRecords=10&query=" + searchString.getText();
     113                        display = display + query + "\n";
    95114                    }
    96115                }
     
    98117
    99118            Messagebox.show(display);
    100 
     119            System.out.println(display);
    101120        } catch (Exception ex) {
    102121            System.out.println(ex.getMessage());
  • SRUAggregator/trunk/src/java/clarind/fcs/Harvester.java

    r2097 r2107  
    1717    final String crStartpoint = "http://130.183.206.32/restxml/";
    1818
    19      private NodeList evaluateXPath(String statement, org.w3c.dom.Document domtree){
     19    private NodeList evaluateXPath(String statement, org.w3c.dom.Document domtree) {
    2020        NodeList result = null;
    2121
     
    2828        return result;
    2929    }
    30      
    31      public String evaluateXPathToString(String statement, org.w3c.dom.Document domtree) {
     30
     31    public String evaluateXPathToString(String statement, org.w3c.dom.Document domtree) {
    3232        String result = null;
    3333
     
    4040        return result;
    4141    }
    42    
    43    
    44     public  ArrayList<Endpoint> getEndpoints() throws Exception {
     42
     43    public ArrayList<Endpoint> getEndpoints() throws Exception {
    4544        ArrayList<Endpoint> ep = new ArrayList<Endpoint>();
    4645
    4746        URL u = new URL(crStartpoint);
    4847        InputStream is = u.openStream();
    49        
     48
    5049        DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
    5150        DocumentBuilder builder = factory.newDocumentBuilder();
     
    5453        is.close();
    5554        String instituteName = evaluateXPathToString("//Name", document);
    56        
     55
    5756        NodeList institutionsUrls = evaluateXPath("//Center_id_link", document);
    58        
     57
    5958        int i, i2;
    60        
    61         for(i=0; i<institutionsUrls.getLength();i++){             
    62              u = new URL(institutionsUrls.item(i).getTextContent());
    63              is = u.openStream();
    64              
    65              org.w3c.dom.Document doc = builder.parse(is);
    66              is.close();
    67              ////WebReference[./Description[text()="CQL"]]/Website                         
    68              
    69              NodeList endpointsUrls = evaluateXPath("//WebReference[./Description[text()=\"CQL\"]]/Website", doc);
    70              
    71              for(i2=0; i2<endpointsUrls.getLength();i2++){
    72                  String epUrl = endpointsUrls.item(i2).getTextContent();                 
    73                  ep.add(new Endpoint(epUrl, instituteName));
    74              } // for i2
    75                          
     59
     60        for (i = 0; i < institutionsUrls.getLength(); i++) {
     61            u = new URL(institutionsUrls.item(i).getTextContent());
     62            is = u.openStream();
     63
     64            org.w3c.dom.Document doc = builder.parse(is);
     65            is.close();
     66            ////WebReference[./Description[text()="CQL"]]/Website                         
     67
     68            NodeList endpointsUrls = evaluateXPath("//WebReference[./Description[text()=\"CQL\"]]/Website", doc);
     69
     70            for (i2 = 0; i2 < endpointsUrls.getLength(); i2++) {
     71                String epUrl = endpointsUrls.item(i2).getTextContent();
     72                ep.add(new Endpoint(epUrl, instituteName));
     73            } // for i2
     74
    7675        } // for i ...
    77        
     76
    7877
    7978        return ep;
    8079    } //getEndpoints
    81    
    82    
    83     public ArrayList<String> getCorporaOfAnEndpoint(String endpointUrl) throws Exception {
    84         System.out.println("getCorporaOfAnEndpoint: " + endpointUrl);
    85         ArrayList<String> corpora = new ArrayList<String>();
    86        
    87         URL u = new URL(endpointUrl + "?operation=scan&scanClause=fcs.resource");
     80
     81    public ArrayList<Corpus> getCorporaOfAnEndpoint(String endpointUrl) throws Exception {
     82
     83        ArrayList<Corpus> corpora = new ArrayList<Corpus>();
     84        String urlToCall = endpointUrl + "?operation=scan&scanClause=fcs.resource&version=1.2";
     85        URL u = new URL(urlToCall);
     86
     87        System.out.println("getCorporaOfAnEndpoint: " + urlToCall);
     88
    8889        InputStream is = u.openStream();
    89        
     90
    9091        DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
    9192        DocumentBuilder builder = factory.newDocumentBuilder();
     
    9394
    9495        is.close();
     96
     97        //http://clarinws.informatik.uni-leipzig.de:8080/CQL?
     98
     99        //NodeList corporaNodes = evaluateXPath("//*[local-name()='term']/*[local-name()='value']", document);
     100        NodeList corporaNodes = evaluateXPath("//*[local-name()='terms']/*[local-name()='term']", document);
     101
     102        int i, i2;
     103        if (corporaNodes.getLength() > 0) {
     104           
     105            System.out.println("Length of corpora: " + corporaNodes.getLength());
     106           
     107            for (i = 0; i < corporaNodes.getLength(); i++) {
     108                Node n = corporaNodes.item(i);
     109               
     110                System.out.println("NODENAEM: " + n.getNodeName());
     111               
     112                Corpus c = new Corpus();
     113
     114                for (i2 = 0; i2 < n.getChildNodes().getLength(); i2++) {
     115                    Node child = n.getChildNodes().item(i2);
     116
     117                    if (child.getNodeName().endsWith("value")) {
     118                        c.setValue(child.getTextContent());
     119                    }
     120
     121                    if (child.getNodeName().endsWith("displayTerm")) {
     122                        c.setDisplayTerm(child.getTextContent());
     123                    }
     124
     125                    if (child.getNodeName().endsWith("numberOfRecords")) {
     126                        c.setNumberOfRecords(child.getTextContent());
     127                    }
     128
     129                } //for i2
     130
     131                corpora.add(c);
     132
     133            } // for i ...
     134        } // if coporaNodes ...
    95135       
    96         //http://clarinws.informatik.uni-leipzig.de:8080/CQL?
    97        
    98         NodeList corporaNodes = evaluateXPath("//*[local-name()='term']/*[local-name()='value']", document);
    99      
    100         int i, i2;
    101        
    102         for(i=0; i<corporaNodes.getLength();i++){
    103           corpora.add(corporaNodes.item(i).getTextContent());
    104            
    105         } // for i ...
     136        System.out.println("------------");
    106137        return corpora;
    107138    }  // getCorporaOfAnEndpoint
    108    
    109    
    110     public static void main (String[] args) throws Exception {
     139
     140    public static void main(String[] args) throws Exception {
    111141        Harvester cr = new Harvester();
    112142        ArrayList<Endpoint> ep = cr.getEndpoints();
    113        
     143
    114144        int i;
    115        
    116         for(i=0; i<ep.size();i++){
     145
     146        for (i = 0; i < ep.size(); i++) {
    117147            System.out.println(ep.get(i).getInstitution() + " " + ep.get(i).getUrl());
    118148        } // for i ...
    119        
    120        
     149
     150
    121151    }
    122    
    123    
    124    
    125    
    126152}
  • SRUAggregator/trunk/web/index.zul

    r2097 r2107  
    2222                        <separator />
    2323                        <label>Language:</label>
    24                         <combobox id="languageSelect" width="150px">                           
     24                        <combobox id="languageSelect" width="150px" value="German">                                                                                                                  
    2525                            <!--<template name="model"> -->
    26                             <comboitem label="German" />
    27                             <comboitem label="English" />
    28                             <comboitem label="Dutch" />
     26                            <comboitem label="German" id="german"/>
     27                            <comboitem label="English" id="english"/>
     28                            <comboitem label="Dutch" id="dutch" />
    2929                            <comboitem label="-More to come-" />
    3030                            <!-- </template> -->
     
    3434                       
    3535                        <groupbox mold="3d" id="allCorpora">
    36                         <caption>All Corpora</caption>
     36                            <caption>All Corpora</caption>
    3737                           
    3838                        </groupbox>
Note: See TracChangeset for help on using the changeset viewer.