全3963文字

 若手エンジニアたちが今、面白い。VR(仮想現実)・AR(拡張現実)やAI(人工知能)、スパコン、暗号、自動運転、デジタルコンクリート、データセンシング――といった各分野でニューウェーブを巻き起こしている。

 本連載は日経クロステックが注目する若手技術者・研究者を取り上げる。最新技術だけでなく、それを生み出す、もしくは支える人物像に迫る。

NTTデータ Data&Intelligence事業部 コンサルティング統括部 コンサルティング担当 主任の齋藤洋氏
NTTデータ Data&Intelligence事業部 コンサルティング統括部 コンサルティング担当 主任の齋藤洋氏
2016年に新卒でNTTデータに入社。同氏が所属するData&Intelligence事業部では法人顧客に対するコンサルティングを手掛け、データ分析からデータ分析の基盤提供などを含めて顧客のデータ活用を支援する。大学院では機械学習を研究。入社後、自然言語処理に面白さを感じ、文書読解エンジン「LITRON(リトロン)」の開発に携わる。(撮影:日経クロステック)
[画像のクリックで拡大表示]

 AI(人工知能)が文書を読解し、そこから知識を抽出する――。こう書くと簡単そうに見えるが、適切な結果を得るための「読解し、抽出する」過程には開発者の技術が凝縮している。今回、本連載に登場するNTTデータ コンサルティング統括部 コンサルティング担当 主任の齋藤洋はこの過程、つまり自然言語データの構造化を効率化する技術の開発に携わっている2016年入社の若手社員だ。

 専門用語や独特の言い回しが頻出するビジネス文書・学術文書などを分析し、そこから有効な情報を引き出そうとすると相応の時間と手間がかかる。機械学習の学習手法の1つである「教師あり学習」を実行するに当たり、人が文書データに対して膨大な「正解」を事前に付与する必要があるからだ。

 齋藤が携わっているのは、まさにこの教師あり学習における正解データ(ラベル)を付与する作業を効率化するための「学習箇所の選定に関する技術」である。この技術はNTTデータが提供する文書読解AIソリューション「LITRON(リトロン)」のエンジンとして結実した。LITRONは例えば再生医療分野の実験結果の予測検証においてその効果が確認されるなど、実利用への展開も進んでいる。「(文書データへのラベル付けを含む学習時間を)10分の1、事例によっては数百分の1くらいまで短縮できる」と齋藤は語る。どのような技術なのか。

自然言語処理に面白さを感じた

 LITRONのプロジェクトはNTTデータが2016年度から開催している「Global Hackathon(グローバルハッカソン)」から生まれた。ある社内グループが2018年のハッカソンに応募したAIに関するプロジェクトが発端だ。そのときのハッカソンの審査員として、齋藤が所属する事業部の事業部長が加わっていて、齋藤自身もこのハッカソンに応募したメンバーと話す機会があった。そんなメンバーとの雑談から「自然言語というのはすごく特別に面白いデータだ、という話になった」。この自然言語に感じる面白さが、齋藤をLITRONプロジェクトへの参画へと導くことになる。