Zu dieser Karteikarte gibt es einen kompletten Satz an Karteikarten. Kostenlos!
48
Tokenizing
• Separate a text (String) to its tokens
• Example — Input:
• „Natural language processing makes fun.“
• Result:
• „Natural“, „language“, „processing“, „makes“, „fun“, “.“
• Best practice is to work without punctuations and
lowercased tokens (normalization of tokens).
• Normalized result:
• „natural“, „language“, „processing“, „makes“, „fun“
• Example — Input:
• „Natural language processing makes fun.“
• Result:
• „Natural“, „language“, „processing“, „makes“, „fun“, “.“
• Best practice is to work without punctuations and
lowercased tokens (normalization of tokens).
• Normalized result:
• „natural“, „language“, „processing“, „makes“, „fun“
Karteninfo:
Autor: CoboCards-User
Oberthema: PTT
Thema: PTT
Schule / Uni: Uni Koblenz
Ort: Koblenz
Veröffentlicht: 08.07.2016