|
From: | Karl Ove Hufthammer |
Subject: | [ordbanken] Fwd: Norsk ordbank er genialt |
Date: | Sun, 10 Jan 2010 14:27:37 +0100 |
User-agent: | Thunderbird 2.0.0.23 (X11/20100108) |
Til medlemmene på ordbanken-diskusjon For litt over ein månad sidan fekk eg ein e-post om eit interessant prosjekt som brukar datafilene frå Norsk ordbank. Eg trur dette også kan vera av interesse for medlemmene her på lista, so eg har fått løyve til å vidaresenda e-posten: -------- Original Message --------
Hei du, er en nordmann som har endt opp i Canada, for tiden tar jeg master om åpne utdanningsressurser ved Universitet i Toronto. Er veldig engasjert rundt åpen tilgang til forskningsartikler, åpne utdanningsressurser, åpen/fri kildekode, etc. Selv om det ikke er faget mitt, har jeg også alltid vært interessert i språk, og driver med litt datalingvistikk på siden (veldig elementære greier). Sammen med en kamerat har vi jobbet med å bygge opp en åpen norsk-kinesisk ordbok på nettet (dette er en del av et større prosjekt med ordbøker fra kinesisk til en rekke språk, samt en kinesisk-kinesisk ordbok, med tegnanalyse, kantonesisk, klassisk kinesisk etc - men jeg jobber mest med den norsk-kinesiske delen). Per i dag finnes det ingen norsk-kinesiske ordbøker på nettet. (Derimot har forskere på UiO utviklet en over tusen-siders papier ordbok, med flere millioner i statsstøtte, som koster 1000 kr i bokhandelen. Jeg kontaktet dem og spurte om de kunne tenke seg å legge ordboka ut som Creative Commons, og nedlastbar, men det var desverre ikke aktuelt. Jeg vet hva jeg hadde gjort, hvis jeg satt på pengesekken i utdanningsdepartementet / forskningsrådet). Uansett, vi kan selvfølgelig ikke sitte og håndskrive en flere tusen siders ordbok på kinesisk og norsk - ingen av oss er formelt trenede lingvister, og ikke har vi ti år og mange stipendiater. Så vi bruker de ressursene som finnes. Vi begynte med å ekstrahere informasjon fra Wikipedia ved bruk av interwiki-lenkene, som ga noe slikt som 150,000 entries (se http://reganmian.net/blog/2009/02/16/release-early-release-often-english-chinese-dictionary-based-on-wikipedia/)... alt fra 謝爾·馬格納·邦德維克 Kjell Magne Bondevik til 全国重点文物保护单位 全國重點文物保護單位 Folkerepublikken Kinas liste over nasjonale historiske minnesmerker og kulturgoder :) Ikke ting man finner i vanlige ordbøker... Siden kameraten min har lært seg norsk i de siste årene hadde han lister med ord han hadde skrevet opp mens han studerte, flere tusen av de vanligste ordene. Så tok vi oversettelsesfilene fra KDE (http://reganmian.net/blog/2009/11/01/creating-a-dictionary-from-kde-translation-files/) - dermed får vi oppslag som Hint for brukerflategenerering 界面生成提示 - nok engang ting man ikke ofte finner i vanlige ordbøker. Selvfølgelig kan alle disse ordbøkene lastes ned, enten under den opprinnelige lisense (for det vi har importert), eller under CC-0 for det vi generer selv. Målet er at vi etterhvert skal bygge opp et miljø av kinesere som studerer norsk, og nordmenn som studerer kinesisk (vi har allerede besøkende fra et norsk buddhistisk forum, et norsk forum for foreldre av adopterte barn fra Kina, kinesiske studenter i Peking som studerer norsk ved Chinese Foreign Language University etc), og at alle disse kan bidra til å bygge opp ordboken. For på samme tid som vi har masse utrolig spennende data man ikke finner andre steder, mangler vi kanskje helt åpenbare ord, som "fugl" ;) Uansett - jeg er alltid på jakt etter nye datakilder som vi kan bruke, og ble veldig glad da jeg fant de norske ordbanken, og at den var både nedlastbar og under GPL (det er så ofte jeg har kommet over prosjekter fra UiO som er låst opp, enten det er den kinesiske ordboka jeg nevnte ovenfor, eller korpora etc, så jeg trodde nesten ikke mine egne øyne først). Nå har vi gjort det tilgjengelig, så hvis du klikker på et ord i den norske oversettelsen, så gjør den et søk i ordbanken. For eksemple, hvis du søker på "spise", så får du bl.a.:
hvis du så klikker på spise igjen, får du et flott søk i ordbanken: Substantiver
Verb
Adjektiv
Utrolig nyttig for kinesere som lærere seg norsk (som min kone)! Ville skrive for først og framst si tusen takk for at du har hjulpet til med å gjøre en så utrolig ressurs tilgjengelig! (Vet at du ikke laget den single-handedly, men hadde nok ikke funnet den om det ikke var for deg). […] Vi holder akkurat på å legge om til en forbedret versjon av nettstedet (skrevet i Ruby), så det er noen linker som ikke funker og slikt for tiden - regner med å ha det noenlunde stabilt om en uke eller to. Den offisielle URLen, og den som du bør nevne hvis du vil fortelle noen om dette etc, er http://www.kaifangcidian.com/norsk (og http://kaifangcidian.com/nuo for kinesisk interface til den norske ordboka). Kaifang Cidian (开放词典) betyr åpen ordbok. Men for å teste ut de nye funksjonene kan du taste inn søket direkte slik: http://kaifangcidian.com/waiyu-xin/norsk/hei (hei er søkeord, kan også være en regexp). Takk igjen for ordbanken!!! Stian -- http://reganmian.net/blog -- Random Stuff that Matters |
[Prev in Thread] | Current Thread | [Next in Thread] |