「NLP勉強会 #1 #NLPStudy」に参加してきました
初心者向けのセッションから、word2vecのような最先端のツールの紹介、また参加者同士の交流ができるワークショップなど、非常に実りの多い幅広い方向けの勉強会でした。
NLP勉強会 目的・進行方針について
(再)入門自然言語処理 #01
@yamano357さんによる発表。
自然言語処理の要素技術
- 形態素解析
- わかち書き:入力文を単語に分割
- 原形化:語形・活用変化している単語を原形に戻す
- 品詞タグ付け:単語の品詞を決定
- 統語解析
- 「綺麗な黒髪の女性」は「綺麗な」が「黒髪」にかかるのか「女性」にかかるのか分からない
- 「言語の文法」に従って文法構造を解析
- 意味解析
- 「単語自体の意味」と「単語間の意味関係」を解析して文の意味を同定
- 文脈解析
- 文の意味は文脈の中で決定されると考えるため、複数の文を解析の単位と見なす
- 省略解析、テキスト構造の構築
自然言語処理の周辺技術
- 機械学習
- 数理最適化
- ネットワーク分析
自然言語処理の応用技術
- テキスト分類
- 情報検索
- 機械翻訳
- 情報抽出
- 自動要約
- 質問応答
- 対話システム
すぐに始める自然言語処理
@yamano357さんによる発表
自然言語処理ツール
言語資源
使用状況(頻度が多いもの)
- 形態素解析器:MeCab
- 構文解析器:CaboCha
- 辞書:日本語語彙体系、京都大学各フレーム
- コーパス類:Wikipedia、Twitter
- ツール類:Moses、GIZA++
- 機械学習ツール:LIBLINEAR
word2vecのご紹介
@piroyoungさんによる発表。
Word2vec from Hiroki Mizukami
言語モデル入門
@akkikikiさんによる発表。
MeCab辞書作りについてのご相談
@nezuqさんによるアイディアソン。
ワークショップの結果はこちら
素人がTF-IDFでキーワード抽出やってみた
@smzkngさんによる発表。
言語処理本紹介
@yamano357さんによる発表。