自然言語処理は人工知能(AI)の研究対象のひとつだ。その取り組みは長年行われてきたものの、深層学習(ディープラーニング)が活用され始めたのは最近の話だ。以降、自然言語処理の技術は年々向上している。
自然言語処理の応用として、校閲や校正が挙げられる。これらの作業を編集者など人間に実行させると時間がかかる。そこで人工知能(AI)を活用した校閲・校正の自動化が研究・開発されている。そこで、校閲・校正における人工知能の仕組みと活用事例について紹介したい。
続きを読む校閲をサポートしてくれる人工知能の仕組みとは?
新聞や出版物で提供される文章は、著者による原稿をそのまま使用するのではない。編集者によって、原稿の校正と校閲が行なわれる。校正と校閲は似て非なる作業である。
校正と校閲の違い
校正とは、原稿を入稿した組版が原稿と同じかどうか確認する作業だ。校正はゲラと原稿を照合し、間違っていないか一字一字確認する作業である。他方校閲は、「閲」という文字が入るように、文章を精査する作業である。内容におかしい箇所があるかを担当者はチェックし、資料を調べて確認する。ただし、原稿は筆者の著作物であるため、担当者の校閲における疑問を筆者にぶつけ、最終的な判断は筆者に委ねられる。
校閲における具体的な作業として、主語と述語の関係におかしな箇所がないか等の文法のチェックが真っ先に挙げられる。このほかにも固有名詞や引用の確認、内容に矛盾がないかなど、チェック項目は多岐に及ぶ。単に日本語の確認だけではないので、想像以上に複雑な作業といえるだろう。
AIと自然言語処理
校閲作業の一部はすでに自動化されている。文章作成ソフト「Microsoft Word」には表記のゆれや常用漢字表にない表現を指摘する機能が搭載されている。手書きで原稿を作成するよりも効率的に校閲することが可能だ。その一方で、「てにをは」等の助詞の間違いは、
機械的な単語のチェックの範疇を超えて、言語の「読解力」にまで踏み込んだ作業だ。このような自然言語処理は長年研究されてきたものの、人間による処理と同等の水準で実力を発揮させることは難しかった。そこで登場するのが人工知能(AI)である。
AIで「てにをは」をチェックするには、自然言語処理の技術が応用される。ある単語の次に来る単語を予測することで、「てにをは」がチェックできるという。AIによる自然言語処理の歴史は古く、かつては文法のルールをシステムに記憶させ、それをもとに文章の読解を行なっていた。しかし深層学習(ディープラーニング)の登場により、単語と単語の結びつきなどを数値化することで、文章を解読する能力が格段に向上した。校閲作業にもこのような最新の自然言語処理技術が応用されているのだ。
実は日本語に自信のない人も使えるのが校閲専門の人工知能ソフト
プロでなくても文章の機会は多い
校閲が必要なのは、プロの作家だけではない。書類の作成など、さまざまなシーンで校閲が必要とされる。とりわけ文章のプロフェッショナルでない人の場合には、読者が正しく読解できるような日本語で執筆するのは難しいかもしれない。そこで必要となるのが高精度な校閲ソフトだ。ソフトが日本語の誤りを指摘してくれることで、文章の質が向上する。さらに、日本語に自信のない人も、文章が校閲されることで、正しい日本語を執筆するための発見があるかもしれない。
ノンネイティブにも役立つ自動校閲
また近年、国際競争力を高めるために、外国人労働者、とくに知識労働者を積極的に国内で登用しようという流れがある。日本語ネイティブでない彼らにとって、「読める」レベルの日本語を書くことは非常に難しい。また校閲する側にとっても、日本語ノンネイティブの意図をくみ取ることが難しい。しかしAIによる自動校閲が実現すれば、校閲者の負担はグッと減り、自動的な校閲が可能になる。校閲作業の省人化にも役立ち、労働生産性の上昇にも貢献するだろう。
株式会社ウェブライダーが提供する文賢(ブンケン)はディープラーニング搭載
読者にやさしい文章提供が夢の開発会社
文賢は、Webプロデューサーであり音楽家でもある松尾茂起氏が立ち上げたウェブライダーが開発した校閲ソフトだ。近年、新聞社や出版社等がWeb上にメディアを立ち上げたり、企業がマーケティングの一環でオウンドメディアを立ち上げたりと、Webライティングの需要は高まっている。その一方で、読者が読みやすい、あるいは魅力的な文章を提供することは容易ではない。ウェブライダーは、伝わりやすい文章を提供できる環境として、文賢をプロデュースした。文賢は校閲・推敲用の支援ツールだが、コミュニケーションをサポートできるようにアップデートする予定があるという。
文賢は、オンライン上でサービスを利用できるために、わざわざソフトを購入する必要もない。文賢にはもともと校閲や推敲の機能が搭載されていたが、ディープラーニングを活用することで、誤字脱字の検出数を高めるという。
従来比8.7倍以上の精度をもつ
ウェブライダーはレッジ(Ledge)とSPJとともに、誤字脱字をチェックするシステムの開発に乗り出した。誤字脱字は校閲のなかでも基本的な作業であり、第1弾としてこの作業にターゲットを絞った。LedgeとSPJは、ウェブライダーやLedgeによる著作データをディープラーニングで学習。誤字脱字を検出するAIモデルを作成した。この学習済みモデルをクラウド上に構築し、オンラインで文字入力すると、誤字脱字があるかをフィードバックするという。ディープラーニングの搭載によって、従来比で8.7倍以上の誤字脱字検出数が実現できたという。
ウェブライダーは今後、文章がもつ雰囲気や温度感の判定にもディープラーニングを活用したいとしている。
方正株式会社と株式会社アスコンの画像認識人工知能で校閲を楽にする
時間のかかるチラシ校正
メディア向けの業務システムを開発する方正と、Webコンテンツを手掛ける広告代理店のアスコンは、AIを活用したチラシ校正支援システムを開発した。Web上の文章と異なり、画像として表現されたチラシ等の広告において、校正するためにはゲラと原稿を照らし合わせる作業が従来行われていた。だがこの方法では、全工程における校正の占める時間の割合が大きい。そのうえ、大量の変更指示を漏れなく反映することは難しく、校正ミスを完全になくすことはできていないという。
画像認識で校閲を自動化
そこで登場するのが、画像認識に強みを発揮するAIだ。方正とアスコンが開発した校正システムは、チラシ原稿の文字データと制作結果の画像データをAIが自動識別し比較することで、校正モレの箇所を発見できるという。これにより、従来問題視されてきた校正ミスと校正時間を減らすことが可能になる。
AIはまず、画像データを自動的に個々の商品ごとにエリア分けする。エリア分けされた商品の画像データと、原稿の文字データとが比較される。画像データに使用される書体が特殊でも、校正が可能だ。
開発した校正システムはすでに、アスコンのチラシ制作現場で実際に運用され、検証段階に入っているという。
みずほ銀行と凸版印刷の人工知能は広告制作物の校閲も可能
みずほ銀行は、凸版印刷と共同で、自社の制作した広告出版物を校閲・校正するAIシステムを開発した。企業の製作物における校閲・校正作業は専門的であり、なおかつ膨大な作業量やスキル、知識を要するため、属人化に頼る傾向がある。そこで省人化を行なうために、AIシステムの導入を決めたという。
広告とはいえ、近年はDTPによる制作など、デジタル化が進んでいる。そのため、自動的に校閲・校正できる環境は揃っている。あとはそれを実現できるソフトウェア、つまりAIの問題だ。近年のAI技術の発達により、ディープラーニングで助詞の使い方まで確認可能になったのも大きい。校閲・校正システムは、「てにをは」などの助詞や漢字変換の誤りだけでなく、金融業界特有の専門用語のチェックも行なえるという。みずほ銀行は、開発したシステムを用いた実証実験を実施するとしている。
まとめ
校閲・校正にAIが導入されることで、膨大な作業と時間を要する工程の効率化が実現される。その一方で、校閲が完全自動化されるかというと難しい問題だ。文章に独特の表記のゆれを意図的に用いる作家がいるなど、文筆業はクリエイティブな作業でもある。
広告など、文体の特殊性が要請されない校閲・校正では、AIによる支援は進んでいくだろう。だが最終的に校閲を確認するのは人間であり、校閲・校正AIとの協業が中心になるのではないだろうか。
<参考>
- ディープ・ラーニングを使った「誤字脱字を指摘する機能」を搭載しました(文賢)
https://blog.bun-ken.net/deep-learning-update/ - ウェブライダー松尾氏が目指す「文賢」によるコミュニケーションの形(ferrit)
https://ferret-plus.com/11097 - レッジ、ウェブライダー、SPJが共同で機械学習を用いた文章校正の共同研究を開始(PRTIMES)
https://prtimes.jp/main/html/rd/p/000000002.000030320.html - AIによる校正支援でチラシ制作コストを大幅削減(方正)
https://www.founder.co.jp/archives/1994 - みずほ銀行と凸版印刷、 AIを活用した校閲・校正システムの実証実験を開始(凸版印刷)
https://www.toppan.co.jp/news/2018/12/newsrelease181206.html - 「テクノロジーとインサイトで描くマーケティングの未来予想図」(『販促会議』2019年2月号)
- 「文字づかいと人工知能」(『Up』Vol.43, No.9)
- 『校正という仕事』(ヴェリタ 編)
- 『人工知能と社会』(栗原聡、長井隆行、小泉憲裕、内海彰,、坂本真樹、久野美和子 共著)
役にたったらいいね!
してください
NISSENデジタルハブは、法人向けにA.Iの活用事例やデータ分析活用事例などの情報を提供しております。
No related posts.