デジタルで絶滅の危機に瀕している「マイナー」言語

言語を含むすべてがグローバル化するウェブにおいて、ソフトウェアにあまりサポートされていないヨーロッパの言語はどれくらいあるのだろうか? 研究ネットワークMeta-Netは、ヨーロッパでは21の言語がデジタルで絶滅する危機にあることを突き止めた。イタリア語は、いまのところもちこたえている。
デジタルで絶滅の危機に瀕している「マイナー」言語

World Map Parchment wallpaper (1920×1200) – outdated, 2006 map” BY GuySie (CC:BY-SA)

旧大陸の多くの言語が、デジタルの時代に生き残れる可能性はわずかしかない。これが、Meta-Net(A Network of Excellence forging the Multilingual Europe Technology Alliance)のヨーロッパ研究者チームの結論だ。彼らはヨーロッパ言語デーを機会にして、「少なくとも21の言語がデジタルでの絶滅の危機にある」と警鐘を鳴らしている。

なぜなら、言語処理に対する技術的サポートが不十分だからだ。自動翻訳や、検索エンジン、スペル・文法チェック、スマートフォン用のインタラクティヴな音声アシスタント、ナヴィゲイションシステムによって用いられる音声合成のソフトウェアのことを考えてみてほしい。そして、ソフトウェアやネットで利用できるアプリにおける、ある言語の「デジタル」な存在は、いまやその言語の活気を維持するための決定的な要素となっている。

しかし、ヨーロッパにおける言語技術の有用性とその利用は、言語によってさまざまだ。Meta-Netは、イタリアのピサにあるコンピューター言語学研究所(CNR:国立学術会議)や、同じくトレントのブルーノ・ケスラー財団の人間言語技術研究ユニットのような、ヨーロッパ34カ国の60の研究センターを統合する機関で、ヨーロッパで話されている30の言語(EUの23の公用語と、それ以外の国家・地域の言語)で現在用いることのできる言語技術を分析した。分野は4つで、自動翻訳、音声インタラクション、テキスト分析、言語リソースの利用可能性だ。結果は明らかだ。考察されたすべての言語において、技術的欠落が存在している。

しかし特に欠けているのは、いくつかの「マイナー」言語における言語技術で、アイスランド語、ラトヴィア語、リトアニア語、マルタ語だけでなく、ブルガリア語、ギリシャ語、ハンガリー語、ポーランド語もデジタル世界で消滅する危機にある。

このため、ヨーロッパ言語デーを契機にして、Meta-Netはヨーロッパの国々に対して、すべての言語的財産にデジタルの未来を保証するために行動するように呼びかけている。

実際、調査結果(オンラインでも参照できる)は、検証された30の言語のうち21において言語処理のためのソフトウェアがごくわずかであるか、もしくは存在しないことを告発している。いずれにせよ、情報サポートで「優」を得られている言語は存在しなかった(英語が「良」で、オランダ語、フランス語、ドイツ語、イタリア語、スペイン語は「可」だ)。

そして、このことは知識と情報の自由な流通のためには有利に働かず、言語的障壁という目に見えない境界によって妨害されることになる。そしてこのことは、長期的にはデジタルの単一市場をつくるという目標にもダメージとなる。

英語が主要な言語であることは事実です。しかし近年では英語のサイトの比率が
アラビア語や中国語と比較して、減少しているのもまた事実です>>>

反対に、もしインテリジェントな機器やアプリケーションを組み合わせれば、言語技術は、ヨーロッパの市民がひとつの共通語を話さなくても互いにコミュニケーションを取ることができるための助けとなることができるだろう。

「わたしたちは毎日、気づかないうちに言語自動処理のソフトウェアを使用しています」と、英マンチェスター国立テキストマイニングセンター(NaCTeM: National Centre for Text Mining)の所長、ソフィア・アナニアドゥーは説明している。

「例えば、わたしたちがオンラインで切符を購入するとき、Googleで検索を行うとき、自動車や携帯電話に声で命令を与えるとき、オンラインでレストランや観光地についての評価を集めるときがそうです」。言語技術は、すでにわたしたちの生活を非常に簡単なものにしてくれていて、多くの方法でわたしたちを助けてくれている。

彼女は続ける。「しかし、デジタル情報が支配的になればなるほど、技術サポートが幅広い言語によって利用可能であることが重要となります。そうでないと、わたしたちの隣人との協力がより難しいものとなるでしょう」。

「結局この分野では、研究者たちが強力な情報技術を利用して、書き言葉であれ話し言葉であれ自然言語を研究して処理し、それによって、例えばある言語から別の言語への自動翻訳のシステムや、短時間で何百万ものマルチメディアファイルを分析して必要な情報を抽出できるシステムを開発しています」と、ケスラー財団の人間言語技術研究ユニットのコーディネイター、ベルナルド・マニーニは強調している。

「例えばGoogleが、数秒の間にわたしたちのイタリア語のリクエストを解釈することができるのは、言語の形態学的規則から出発して、ネットに含まれているすべての情報をインデックス化することを可能にする言語技術のおかげです。感情分析、もしくはデータベースから重要な情報を抽出してそのそれぞれにポジティヴやネガティヴな価値を与える機能は、例えばBooking.comによって提供されているようなオンライン予約サーヴィスに応用することができますが、それはこうしたコンテンツを解読して分析することのできる言語技術に基づいています」。

このため、もしさまざまな言語において適切な技術的リソースがなければ、ネットのさまざまなサーヴィスを利用できる最適な条件も存在しなくなる。「英語が主要な言語であることは事実です。しかし近年では、英語のサイトの比率が、例えばアラビア語や中国語、スペイン語のようなほかの言語と比較して、減少しているのもまた事実です」と続けている。

リポート「デジタル時代のイタリア語(The Italian Language in the Digital Age)」で読むことができるように、イタリア語を話すインターネットユーザーの比率も、将来には減少するだろう。そしてイタリア語はウェブにおいて存在感を失うかもしれない。

要するに、わたしたちイタリア人の言語は、デジタルでの絶滅の危機にはないが、イタリア語にとっても、日常的な使用のために本当に有効な技術的ソリューションをもてるようになるにはさらなる研究が必要だ。

「文化的財産の保護には言語も関係していて、このため言語のための情報サポートを発展させることは重要です。しかし、技術の進歩の背後には、研究があることを認識することが必要です。そして、研究は支援を必要としています」と、マニーニは締めくくっている。

TEXT BY SIMONA REGINA
TRANSLATION BY TAKESHI OTOSHI

WIRED NEWS 原文(Italian)