Opened 12 years ago

Closed 10 years ago

#227 closed enhancement (fixed)

deal in a better way with multiple description fields

Reported by: dietuyt Owned by: Twan Goosen
Priority: major Milestone:
Component: VLO importer Version:
Keywords: Cc: schiel@bas.uni-muenchen.de, teckart

Description (last modified by Twan Goosen)

If a CMDI contains different description fields they are all merged into 1 field. This can be very confusing for complicated files (see report below by l.vanmeel@let.ru.nl - Linda van Meel)

We should look at how to deal with this, some possibilities:

  • at least (eg with whitespace) separate the different descriptions
  • only use the most general description (maybe only for specific profiles like IMDI)
  • add a language indication when multilingual descriptions exist

Report (please keep Linda informed about possible fixes):

"Was net even de DBD-database op VLO aan het bekijken en dan met name natuurlijk de subdatabases waar ik aan gewerkt heb. Het viel me op dat bij description stukken teksten aan elkaar zijn geplakt. Bij sommige gesprekken zijn bij de descriptions in the IMDI-browser echter geen namen bij de beschrijving van de Actors genoemd. Daardoor krijg je soms een rare tekst, zoals bijvoorbeeld bij het gesprek

http://catalog.clarin.eu/vlo/record?docId=hdl:1839/00-0000-0000-0008-C212-4@format%253Dcmdi.

In dit gesprek spreken 2 meisjes. In de description staat

"[...] Dorian de Haan is the coordinator/collector of this project. She is of Dutch origin. She works at the University of Utrecht, The Netherlands, at the Developmental Psychology department., This girl is born in Suriname and moved with her family to the Netherlands. In Suriname she lived in Paramaribo. She has been living in the Netherlands for 9 years. Currently

she is in the last form of primary school. She is 12 years old. According to herself she speaks better Dutch than Sarnami. Same girl as in 9D, 18A & 18B., This girl is born in Suriname and moved with her family to the Netherlands. In Suriname she lived in Paramaribo. It is unknown how long she has been living in the Netherlands.

She is 11 years old and in the last form of primary school. She says that her dutch is better than her Sarnami.

Same girl as in 9E, 18C, 18D & 18E." (vette nadruk door mij)

Er staat dus 2x "this girl" terwijl er geen naam oid genoemd wordt. Dit staat nogal raar zo.

Vergelijk met hoe het in het gesprek in de IMDI browser staat: http://corpus1.mpi.nl/ds/imdi_browser/ > DBD > Sranan:Sarnami > Sarnami-Dutch > Dutch > Conversation > DBD_DH_001A. De teksten zijn dus letterlijk overgenomen, maar daardoor weet je hier niet over welke sprekers (Actors) het gaat.

Echter als ik bij verschillende gesprekken kijk, lijkt bij de meeste andere gesprekken wel namen genoemd te worden in de beschrijvingen. Zoals bijv. bij gesprek

http://catalog.clarin.eu/vlo/record?docId=hdl:1839/00-0000-0000-0008-C143-8@format%253Dcmdi.

Hierbij klopt het wel omdat de namen ook in de Actor-beschrijvingen in de IMDI-browser staan (zie DBD > Turkish-Dutch > Dutch > Conversation > DBD_DH_001B).

Dus misschien moet er nog eens gekeken worden in de IMDI-browser bij welke gesprekken de naam van een Actor niet in de beschrijving van de Actor staat."

Zoals ik het kan zien, wordt bij Descriptie bij de records alle informatie uit alle beschikbare descriptievelden voor de desbetreffende sessie opgenomen. Dit kan heel verwarrend zijn. In de bijbehorende CMDI files is de metadata over de verschillende proefpersonen wel netjes in het juiste veld terechtgekomen.

Is het misschien een idee om hier eens naar te kijken? Het lijkt mij beter als bv. alleen de descriptie van het project en van de sessie in het descriptieveld op het 'titelblad' terechtkomen. Dit lijkt me tamelijk eenvoudig te veranderen.

Change History (11)

comment:1 Changed 11 years ago by dietuyt

Cc: schiel@bas.uni-muenchen.de added
Description: modified (diff)
Priority: minormajor

comment:2 Changed 11 years ago by dietuyt

Cc: teckart added
Owner: changed from herste to keeloo
Status: newassigned

comment:3 Changed 11 years ago by keeloo

In the 2.16 release of the VLO, descriptions will include newlines.

comment:4 Changed 11 years ago by dietuyt

Milestone: VLO-2.16

comment:5 Changed 11 years ago by dietuyt

Milestone: VLO-2.16VLO-2.17

comment:6 Changed 11 years ago by dietuyt

the multilinguality part of this ticket goes to VLO 2.17

comment:7 Changed 10 years ago by twagoo

Milestone: VLO-2.17VLO-3.0

comment:8 Changed 10 years ago by Twan Goosen

Owner: changed from keeloo to Twan Goosen

Kees Jan no longer works on VLO. Assigning all VLO web app tickets owned by KJ to Twan

comment:9 Changed 10 years ago by Twan Goosen

Component: VLO web appVLO importer
Milestone: VLO-3.0

VLO 3.0 clearly separates distinct descriptions. Actor descriptions as mentioned in the example should not be included, which is an importer issue (compare to #246).

Another importer suggestion: store description languages with descriptions so that the web app can show this information and even show the descriptions in language matching the client's locale first. If we decide to do this, separate tickets for importer and web app should be created.

Moving this to importer. Can be closed as soon as tickets for the related issues are created.

comment:10 Changed 10 years ago by Twan Goosen

Description: modified (diff)

fixed VLO links

comment:11 in reply to:  9 Changed 10 years ago by Twan Goosen

Resolution: fixed
Status: assignedclosed

Replying to twan.goosen@…:

Moving this to importer. Can be closed as soon as tickets for the related issues are created.

Created #667 as follow-up, closing this

Note: See TracTickets for help on using tickets.