Changes between Version 1 and Version 2 of VLO-Taskforce/Feedback-of-the-FAGs


Ignore:
Timestamp:
06/18/15 06:58:57 (9 years ago)
Author:
herold@bbaw.de
Comment:

--

Legend:

Unmodified
Added
Removed
Modified
  • VLO-Taskforce/Feedback-of-the-FAGs

    v1 v2  
    11= [wiki:VLO-Taskforce VLO Taskforce] Feedback of the F-AGs =
     2
     3'''Notes:'''
     4
     5* F-AGs are domain specific working groups supporting CLARIN-D.
     6* To view the original German version of this page use the page history.
     7
     8
    29== F-AG 6 (Petra Wagner) ==
    3 Regarding Facet 11: Modality[[BR]]
    410
    5 "Vielleicht übersehe ich etwas Offensichtliches, aber ich finde den Mix des Übertragungskanals/des Signals (Audio, Video, Text) und der Produktionsmodalität (gesprochene Sprache, sprachbegleitende Gestik, geschriebene Sprache) schwierig, weil der Kanal ja zunächst völlig agnostisch hinsichtlich der übertragenen Modalität ist, d.h. der visuelle Kanal überträgt Artikulations-, Hand-, Körper und Kopfgesten, aber vielleicht auch Tanz, Bilder, Texte oder den Prozess der Textproduktion (Schreiben). Gestische Informationen können außerdem auf unterschiedlichen Signalwegen übertragen werden, z.B. Video, EMA, MoCap. Aber ich glaube, ich brauche noch mehr Erläuterungen, um das vorgeschlagene Vokabular zu verstehen. Ich bin gern bereit, mit der VLO-Gruppe darüber bei Gelegenheit zu diskutieren."
     11(Regarding Facet 11: Modality)
     12
     13 »I might be missing something obvious, but I consider mixing information on the communication channel (for the signal: audio, video, text) and information on the modality (spoken vs. written language, gesture) as problematic. The channel is essentially completely agnostic with respect to the modality that is transmitted. I. e. the visual channel transmits articulatory, hand, body or head gestures, maybe also dance, images, texts or even the process of text production (writing). Gesture can be transmitted by different channels, e. g. video, EMA, MoCap. I think we'll need more details to fully understand the proposed vocabulary. I'd like to further discuss this issue with the VLO-TF.
    614
    715== F-AG 10 (Thomas Werneke) ==
    8 * Facetten sollten bereits auf der Startseite sichtbar sein
    9 * Ebenfalls von der Startseite aus sollte Dokumentation zur Nutzung und zum VLO allgemein verlinkt/angeboten werden (auch ein kleiner Einführungstext direkt auf der Startseite wäre schön)
    10 * Suchergebnisse:
    11  * diese sollten generell sortierter erscheinen, z.B. durch:
    12   * Farbschema
    13   * Gruppierung von Treffern nach bestimmten Kriterien
    14   * Icons je Treffer, welche den jeweiligen Resource Type symbolisieren
    15  * mehr als 10 Treffer auf einmal anzeigen
    16  * Erstansicht der Ressourcen in der Trefferliste sollte sprechender sein --> Resource type, Genre, Fach auf den ersten Blick sichtbar machen
    17  * Hierarchisierung der Suchergebnisse wäre wichtig
    18   * n.b.: Hierarchisierung der Werte nach Häufigkeit kann dabei nur ein erster schneller Ansatz sein
    19 * Time Coverage-Facette wäre sinnvoll und hilfreich
    20 * Erweiterte Suche wäre hilfreich, die es ermöglicht, z.B. "Zeitung" zu suchen und alle Zeitungen zurück zu erhalten
    21 * Möglichkeit, eigene Kollektionen erstellen zu können, wäre interessant
     16
     17* facets should be visible on the start page
     18* user documentation should be available from the start page (or at least a link should be provided); a short introductory note would be nice
     19* search results:
     20 * should be always sorted/ranked/marked, e .g.:
     21  * using a dedicated color scheme
     22  * by clustering according to a specific set of criteria
     23  * by providing an icon representing the resource type for each result
     24 * users should see more than 10 results
     25 * in the result list, the entries should be more self describing; resource type, genre, domain should be visible on first sight
     26 * hierarchical presentation (note from translator: probably rather ranking?) of the results is important; ordering by frequency can only be seen as a first quick and dirty approach
     27* a facet for time coverage will be important and useful
     28* extended search interface would be useful, e. g. allowing queries for all newspapers
     29* a possibility to create your own collections would be nice
    2230 
    2331
    24 == F-AG leaders, meeting 15th May 2015 ==
    25 * Fachblick vs. große allgemeine Sammlung kommen sich in die Quere --> stärker disziplinär fokussierter Zugriff wäre wichtig
    26 * Teilw. schwer nachvollziehbare Resultate durch Sortierung, z.B. Suche nach „Germanistik“ als Schlagwort
    27 * Gruppierung von Resultaten möglich? Z.B. einzelne Ressourcen wie Wortschatz o.ä. zusammen bündeln?
    28 * Z.T. Doppelung von Ergebnissen („Lindat“ Ressourcen, die auch in Tschechien gehostet werden)
    29 * Wie kann ich prüfen, ob es eine Ressource schon gibt?
    30 * Wie kann ich eine neue Ressource melden? Verfahren für eine „niedrigschwellige“ Meldung wäre schön
    31 * Verschlagwortung mit mehreren Schlagworten sollte möglich sein (Mehrere Metadaten-Format Schlagworte als Einzelelemente, statt konkatenierte Strings getrennt mit „;“ o.ä.);
    32 * Schlagwort/Keyword: Fixe Vokabulare sind ggf. problematisch... freie Verschlagwortung ist der realistischere Fall
    33 * Mapping von synonymen Schlagworten, die in mehreren Sprachen vorliegen, wäre sinnvoll
    34 * Use Case Sammlung existiert bereits (z.B. „Wie bekomme ich alle Nominalphrasen aus einem Korpus?“) --> gute Orientierungsmöglichkeit [sh: gemeint sind die "100 Nutzerfragen der F-AGs"]
    35 * Repräsentativität von Korpora ist in den Sozialwissenschaften wichtig --> Komplexe Suchanfragen für Volltext und Metadaten sind notwendig (ggf. mit linguistischen Annotationen, um Sampling-Fehler zu reduzieren)
    36 * Erweiterte Suche wäre hilfreich
     32== Feedback from F-AG leaders, meeting 15th May 2015 ==
     33
     34* trade-off between users' domain specific search demands and the general purpose presentation of resources in the VLO → search facilities should be more narrowly targeted to different scientific domains
     35* current sorting leads to result lists that are difficult to understand and use, e. g. as returned by a search for »Germanistk« as keyword
     36* clustering of results an option? e. g. grouping of single resources that are part of bigger collections (»Wortschatz Leipzig«)
     37* some resources appear twice due to the LINDAT-CZ mirror
     38* How can I confirm a resource is already in the VLO? (note from translator: This question is unclear to me.)
     39* How can I report missing/new resources? There should be a fast and easy way to do this.
     40* more than one keyword should be provided seperately, i. e. not concatenated into a single string by joining the keywords with ";" or another typographic device
     41* keyword: fixed vocabulary might be problematic; it's more realistic to expect an open set of keywords
     42* A mapping across synonymous keywords in different languages would be useful.
     43* There is already a set of use cases (e .g. »How can I extract all NPs from a corpus?«) (note from Susanne: i. e. »Hundred questions of the F-AGs«)
     44* In the social sciences, it's important to ensure representative sampling from resources → complex queries for full text and metadata must be possible (also for linguistic annotations to reduce the amount of sampling errors)
     45* extended search would be useful