Opened 12 years ago
Closed 10 years ago
#227 closed enhancement (fixed)
deal in a better way with multiple description fields
Reported by: | dietuyt | Owned by: | Twan Goosen |
---|---|---|---|
Priority: | major | Milestone: | |
Component: | VLO importer | Version: | |
Keywords: | Cc: | schiel@bas.uni-muenchen.de, teckart |
Description (last modified by )
If a CMDI contains different description fields they are all merged into 1 field. This can be very confusing for complicated files (see report below by l.vanmeel@let.ru.nl - Linda van Meel)
We should look at how to deal with this, some possibilities:
- at least (eg with whitespace) separate the different descriptions
- only use the most general description (maybe only for specific profiles like IMDI)
- add a language indication when multilingual descriptions exist
Report (please keep Linda informed about possible fixes):
"Was net even de DBD-database op VLO aan het bekijken en dan met name natuurlijk de subdatabases waar ik aan gewerkt heb. Het viel me op dat bij description stukken teksten aan elkaar zijn geplakt. Bij sommige gesprekken zijn bij de descriptions in the IMDI-browser echter geen namen bij de beschrijving van de Actors genoemd. Daardoor krijg je soms een rare tekst, zoals bijvoorbeeld bij het gesprek
http://catalog.clarin.eu/vlo/record?docId=hdl:1839/00-0000-0000-0008-C212-4@format%253Dcmdi.
In dit gesprek spreken 2 meisjes. In de description staat
"[...] Dorian de Haan is the coordinator/collector of this project. She is of Dutch origin. She works at the University of Utrecht, The Netherlands, at the Developmental Psychology department., This girl is born in Suriname and moved with her family to the Netherlands. In Suriname she lived in Paramaribo. She has been living in the Netherlands for 9 years. Currently
she is in the last form of primary school. She is 12 years old. According to herself she speaks better Dutch than Sarnami. Same girl as in 9D, 18A & 18B., This girl is born in Suriname and moved with her family to the Netherlands. In Suriname she lived in Paramaribo. It is unknown how long she has been living in the Netherlands.
She is 11 years old and in the last form of primary school. She says that her dutch is better than her Sarnami.
Same girl as in 9E, 18C, 18D & 18E." (vette nadruk door mij)
Er staat dus 2x "this girl" terwijl er geen naam oid genoemd wordt. Dit staat nogal raar zo.
Vergelijk met hoe het in het gesprek in de IMDI browser staat: http://corpus1.mpi.nl/ds/imdi_browser/ > DBD > Sranan:Sarnami > Sarnami-Dutch > Dutch > Conversation > DBD_DH_001A. De teksten zijn dus letterlijk overgenomen, maar daardoor weet je hier niet over welke sprekers (Actors) het gaat.
Echter als ik bij verschillende gesprekken kijk, lijkt bij de meeste andere gesprekken wel namen genoemd te worden in de beschrijvingen. Zoals bijv. bij gesprek
http://catalog.clarin.eu/vlo/record?docId=hdl:1839/00-0000-0000-0008-C143-8@format%253Dcmdi.
Hierbij klopt het wel omdat de namen ook in de Actor-beschrijvingen in de IMDI-browser staan (zie DBD > Turkish-Dutch > Dutch > Conversation > DBD_DH_001B).
Dus misschien moet er nog eens gekeken worden in de IMDI-browser bij welke gesprekken de naam van een Actor niet in de beschrijving van de Actor staat."
Zoals ik het kan zien, wordt bij Descriptie bij de records alle informatie uit alle beschikbare descriptievelden voor de desbetreffende sessie opgenomen. Dit kan heel verwarrend zijn. In de bijbehorende CMDI files is de metadata over de verschillende proefpersonen wel netjes in het juiste veld terechtgekomen.
Is het misschien een idee om hier eens naar te kijken? Het lijkt mij beter als bv. alleen de descriptie van het project en van de sessie in het descriptieveld op het 'titelblad' terechtkomen. Dit lijkt me tamelijk eenvoudig te veranderen.
Change History (11)
comment:1 Changed 11 years ago by
Cc: | schiel@bas.uni-muenchen.de added |
---|---|
Description: | modified (diff) |
Priority: | minor → major |
comment:2 Changed 11 years ago by
Cc: | teckart added |
---|---|
Owner: | changed from herste to keeloo |
Status: | new → assigned |
comment:3 Changed 11 years ago by
comment:4 Changed 11 years ago by
Milestone: | → VLO-2.16 |
---|
comment:5 Changed 11 years ago by
Milestone: | VLO-2.16 → VLO-2.17 |
---|
comment:7 Changed 11 years ago by
Milestone: | VLO-2.17 → VLO-3.0 |
---|
comment:8 Changed 11 years ago by
Owner: | changed from keeloo to Twan Goosen |
---|
Kees Jan no longer works on VLO. Assigning all VLO web app tickets owned by KJ to Twan
comment:9 follow-up: 11 Changed 10 years ago by
Component: | VLO web app → VLO importer |
---|---|
Milestone: | VLO-3.0 |
VLO 3.0 clearly separates distinct descriptions. Actor descriptions as mentioned in the example should not be included, which is an importer issue (compare to #246).
Another importer suggestion: store description languages with descriptions so that the web app can show this information and even show the descriptions in language matching the client's locale first. If we decide to do this, separate tickets for importer and web app should be created.
Moving this to importer. Can be closed as soon as tickets for the related issues are created.
comment:11 Changed 10 years ago by
Resolution: | → fixed |
---|---|
Status: | assigned → closed |
Replying to twan.goosen@…:
Moving this to importer. Can be closed as soon as tickets for the related issues are created.
Created #667 as follow-up, closing this
In the 2.16 release of the VLO, descriptions will include newlines.