VOXVIP – smart crowdsourcing

Crowdsource4dk eventen den 23. januar 2016 i Koncerthuset DR Byen præsenteres CoSound VOXVIP spillet. Spillet går ud på at gætte kendte DR radiostemmer og er et eksempel på nye metoder til ’smart crowdsourcing’, som indgår i en effektiv løsning til at berige radioarkivet med søgbar information. Det giver nye muligheder for at formidle radiokulturarven til danskerne, nye muligheder for kulturforskere, samt søge- og redigeringsværktøjer til mediebranchen.

Digitalisering af lydarkiver er første skridt til at gøre dem bredt tilgængelige. Værktøjerne til at navigere i dem er det naturlige næste – og helt afgørende skridt. I CoSound-projektet forskes i teknologiske systemer og metoder, der interaktivt kan berige lyd med metadata. Dette er fundamentet for den næste generation af navigeringsværktøjer til lydarkiver. Ved hjælp af matematiske algoritmer og crowdsourcing gør denne forskning det muligt på en effektiv måde at berige lydarkiver med metadata i forhold til traditionel manuel gennemlytning og annotering.

Disse værktøjer kan bruges til at berige digitale lydarkiver f.eks. radio og TV udsendelser, men er også relevante for nye musikservices. Det kan sikre bedre adgang til sange, som potentielt er interessante at lytte til blandt de 30 millioner sange, som er tilgængelige i de fleste streaming-services.

Det giver nye muligheder både for almindelige borgere, f.eks. en skoleklasse, der laver opgave om temaet: ”kulturen i 70’erne”. Men også muligheder for nye søgeværktøjer til professionelle brugere som journalister, eller forskningsværktøjer til kultur- og medieforskere. ”Digitial Humaniora” er en ny trend og paradigmeskift indenfor humanistisk forskning, som baserer sig på såkaldt big data og storskala-analyser, og ’smart crowdsourcing’ værktøjer bidrager til at realisere dette.

Et eksempel på navigation i radioarkiver er muligheden for at kunne søge efter, hvornår en bestemt person taler. Manuel annotering af hele arkivet for alle mulige talere er dog ikke en mulig eller fremtidssikret fremgangsmåde. Derfor har CoSound projektet udviklet algoritmer, der intelligent kan udvælge lydklip med talere, som skal identificeres ved hjælp af crowdsourcing. Algoritmerne kan herefter finde talerne i hele radioarkivet.

Spillet VOXVIP har til formål at indsamle kendte radiostemmer og er blot ét eksempel på metadata, man kan berige lydarkiverne med. Det overordnede formål er at sikre høj kvalitet af metadata fremskaffet på en effektiv måde, som samtidigt minimerer behovet for brugerinteraktion. Værktøjet bliver klogere jo mere det bliver brugt, både af professionelle og befolkningen i al almindelighed, og i princippet, er der uendeligt mange ting, man kunne være interesseret i at lede efter. For eksempel kunne man også være interesseret i at vide, hvad der bliver sagt (talekendelse), hvilken musik der bruges som underlægning, eller hvordan jingler er blevet brugt i et historisk perspektiv. Forskningsmæssigt vil vi derfor undersøge om smart crowdsourcing baseret på nyudviklede machine-learning-algoritmer bidrager til en mere effektiv fremskaffelse af information, og hvordan gamification yderligere kan bidrage til dette.

Spillet er udviklet i et samarbejde mellem CoSound partnere. Danmarks Radio har udvalgt radioarkivmateriale og har sammen med Danmarks Tekniske Universitet (DTU) og Socialsquare ApS designet spilmekanismen. DTU har desuden designet bagvedliggende machine-learning-algoritmer og crowdsourcing-mekanismer, som udvælger de klip, der skal lyttes til. ChaosInsight ApS har designet og udviklet bagvedliggende CoSound database- og beregningsplatform og Statsbiblioteket stiller computer infrastruktur til rådighed til beregninger og streaming af lyd fra radioarkivet.

Tilmelding til Crowdsource4dk: https://www.facebook.com/events/1554726201514303/

Kontakt: Professor Jan Larsen, DTU Compute, janla@dtu.dk, +45 22430025

Følg @cosounddk og #voxvip på Twitter