奥野 陽 (Yoh Okuno) 履歴書
English Version
プロフィール
自然言語処理,機械学習,データマイニングを専門とするソフトウェアエンジニア.主な開発環境はC/C++,Python,Hadoopなど.論文発表,オープンソースソフトウェア,商用ソフトウェアの開発経験があり,理論的な知識と実践的な設計を組み合わせることを得意としている.
スキル
- プログラミング言語: C/C++ (経験10年), Java, Python, PHP, Perl, JavaScript, R, SQL
- ミドルウェア: Hadoop, Apache, MySQL, Thrift, NLTK, mecab, marisa-trie, DirectX
- プラットフォーム: Linux, Android, Windows, Mac OS X, FreeBSD
職務経歴
Swiftkey,2012年〜現在
ソフトウェアエンジニア,言語処理部
日本語入力システムのための自然言語処理を担当しています。
ヤフー株式会社,2009年〜2012年
ソフトウェアエンジニア,R&D統括本部
大規模ブログテキストを用いた統計的かな漢字変換エンジンの試作を行いました.高速かつ省メモリな辞書検索システムを開発し,プレーンテキストと比べてメモリ消費量を40%削減しました.また,より大規模な辞書を用いることで,Google日本語入力を超える93%の変換精度(文字単位のF値,IPAコーパスで評価)を実現できることを明らかにしました.
予測変換のための複合語抽出アルゴリズムの設計と実装を行い,スパムフィルタ,形態素解析,発音推定のアルゴリズムを組み込みました.適合率0.90と再現率0.81を達成し,辞書サイズを約80%削減することに成功しました.
Hadoop MapReduceを用いて,1TBにも及ぶ大規模日本語ブログテキストからの単語N-gram集計システムを実装しました.独自の高速化により元のアルゴリズムより2倍の速度を実現し,最良で5.65ビットのクロスエントロピーを達成しました.
未踏ソフトウェア創造事業,2007年〜2008年
Social IME 〜みんなで育てる日本語入力〜
大学院在籍中に未踏ソフトウェア創造事業に採択され,「みんなで育てる日本語入力」をキャッチコピーに新しいタイプの日本語入力システム「Social IME」を開発・公開し,20回以上も雑誌に掲載されました.予測変換によって21%のキー入力を削減し,1ヶ月間あたり18億回以上のアクセスと700万人以上のユニークユーザ数を獲得しました.
コンピュータゲーム制作,2006年
大学在籍中に個人制作として弾幕シューティングゲームを開発し,1000本以上を販売し100万円以上を売り上げました.このゲームの開発では,C++で2万行以上のソースコードをDirectXを用いたライブラリレベルからスクラッチで書き上げました.
論文(第一著者)
- An Ensemble Model of Word-based and Character-based Models for Japanese and Chinese Input Method, Workshop on Advances in Text Input Methods, the 24th International Conference on Computational Linguistics, 2012.
- Applying mpaligner to Statistical Machine Transliteration with Japanese-Specific Heuristics, The 4th Named Entities Workshop, in the 50th Annual Meeting of the Association of Computational Linguistics, 2012.
- Phrase Extraction for Japanese Predictive Input Method as Post-Processing, Workshop on Advances in Text Input Methods, in the 5th International Joint Conference on Natural Language Processing, 2011.
- Spell Generation based on Edit Distance, Spelling Alteration for Web Search Workshop, 2011.
- 大規模日本語ブログコーパスにおける言語モデルの構築と評価,言語処理学会第17回年次大会,2011.
- インターネットを用いた日本語入力システム,情報処理学会第190回自然言語処理研究会,2009.
書籍
その他の業績
学歴
慶応義塾大学 理工学部 情報工学科 萩原研究室
-
修士(情報工学),2009年.
修論テーマ:インターネットを用いた日本語入力システム
-
学士(情報工学),2007年.
卒論テーマ:ニューラルネットワークを用いた協調フィルタリング
連絡先