Child pages
 • Møtref 17. desember
Skip to end of metadata
Go to start of metadata
 • Kapittel 5 + 6 kan slås sammen.
 • Bakgrunnskapittel og related works er litt blandet, med ulike ting som dukker opp. 
 • Kapittel 2, 3 og 4 blander en del ting. 
 • Se nøye på kapittel 4. Se på hva som faktisk er background og hva som jeg selv har gjort.
 • F-score 
 • HVORFOR Wikipedia, se på hvilke alternativer som fins, skriv en redegjøring for hvorfor Wikipedia ble brukt istedetfor andre inputkilder.
 • F. eks. fins Geonames? Area-informasjon. Kan være datakilde. (geonames.jp)
 • Sjekk jp.dbpedia.org <- de har gjort arbeid med wikipedia. Om publisert om det blir det RELATED WORK, om ikke publisert blir det BAKGRUNN.
 • Wordnet kan være relevant. Men japansk wordnet fins kanskje ikke? Blir laget i Tokyo?
 • Arbeidet som JAIST sponser, Nara og U. Tokyo og flere... Uvisst hva det heter? (NAIST)
 • 1.3 Objective 3: Skru ned forventningene om å lage searchable web system. 
 • Utvide Vocabulary: Part of Speech, Bag of Words, JAIST, etc etc. Se an hva som trengs forklaring. Shortlist of terms. POS-tag etc. Forkortelser etc. Utenlandske ord og fortkortelser generelt må være med! Anta at folk kan engelsk, ikke mer. NLP (Google refererer jo til Neurolinguistic Programming). RQ kan forklares. Etc.
 • Angående Captions: Begin Table istedetfor Begin Center. Så Caption inn dit. Last ned template og se hvordan de gjør det. Fiks alt sånne småting.
 • Gå gjennom UNDERFULL HBOX helt til slutt og fiks de små errorene. Da blir teksten mye finere.
 • Future Work: Skal under Discussion.
 • Kapittel 2: Kan bli Background & Related Works
 • Figure 2.1: Gi mer credit. Bytte ut tekst med noe mer meningsfult, evt. slenge på en citation.
 • Side 18: Kuromoji-beskrivelsen må ha en tabell for hvert 
 • Skrive om Wikipedia data types der hver kort nevnes, og så skrive beskrivelse for hver type.
 • Kapittel 6: Lag figur slik at alt gir mening (med tanke på alle enkeltalgoritmene etc) Dette er riktig tidspunkt for å skrive dette så det går fint. 
 • Kap 7: Mye punktlister. Ser veldig uferdig ut, ikke så veldig proft. Skift hvordan algoritmene som ble brukt skrives opp.
 • Setningen om baseline må forenkles. Nå er det gresk.
 • Enten Prosent for både PRECISION OG RECALL OG F-SCORE. Trenger ikke to desimal. Om ikke prosent, bruk desimaler. Vær konsistent.
 • Fjern bullet points fra kapittel 7.
 • Bag of Words - kan se på. Men si noe om det med. Stemming etc. Se på related works om Bag of Words.
 • Samle resultatene i en tabell slik at alt er sammen.
 • Established has been established <- Få inn navn på forfatter? Citations burde få med årstall og forfatternavn for å øke lesbarhet.
 • CItations: \citet{...} i natbib ELLER hvis man ikke bruker natbib noe som \newcommand\citet[1]{\citeauthor{#1}~\shortcite{#1}}

 • No labels