AI(人工知能)をベースにした音声認識ソフトの情報を、近年はネットなどでよく見かけるようになりました。人が話した言葉をAIがテキスト化してくれるというもので、その精度は日進月歩で高くなっています。
こうしたソフトを使って音声をテキスト化することを、「AIテープ起こし」「AI文字起こし」「AI書き起こし」などと呼ぶこともあります。
AIによる音声認識ソフトを利用することで、きわめて効率よくテープ起こしを行うことができます。また、録音済の音声ファイルからのテキスト化だけでなく、リアルタイムで話された内容もテキストへと変換することも可能です。
しかも、こうした音声認識ソフトは有料版だけでなく、無料のソフトも多数登場しています。そこで、無料で利用できるAIテープ起こしソフトを、いくつかご紹介します。
Texter
iPhoneのテープ起こしアプリです。音声以外に動画からのテキスト化にも対応。リアルタイムでのテープ起こしも可能です。
Speechy
iPhoneのテープ起こしアプリです。iPhoneの録音アプリ「ボイスメモ」で録音した音声もテキスト化できます。
Googleドキュメント
Googleドキュメントはウェブブラウザ内で動くオフィスソフトで、無料で使用することができます。多くの機能がある中に、自動でテキスト化してくれるAIテープ起こしもあります。ただ、リアルタイムのテキスト化は操作も簡単ですが、録音済の音声ファイルからテキスト化するのは、初心者には設定が面倒かもしれません。
テープ起こしを自動で行ってくれる音声認識ソフトは、上手く使えば作業効率を飛躍的にアップできる、大変便利なものです。その一方で、ネット記事等に書いてあるように、スムーズまたは正確にテキスト化できないという声も、実際に使ったからはよく耳にします。
上手に使うポイントはいくつかあるようですが、その一つが音声の質です。直接の音声入力にしろ、録音音声にしろ、雑音のないクリアな音声であることはもちろん、話すスピード、話の長さ、話者人数、話の間(ま)、発音、言葉遣いなど、要は聞き取りやすい音声であることが必要といえます。
例えば、ブログの記事用などに、静かな場所でマイクに口を近づけて、1人でハッキリとした口調で丁寧に話せば、かなりテキスト化の精度は高くなります。逆に、広い会議室で、大勢の話者が自由に語り合う座談会の録音音声だったりすると、テキスト化の精度はどうしても落ちます。
どんな条件なら音声認識ソフトが役立つか、試行錯誤しながら覚えていく必要はありそうです。その意味では、テープ起こし自体が頻繁に必要でないような人は、苦労して使えるようになっても、あまり報われることはないかもしれませんね。
AIをベースにした音声認識ソフトの精度が、日進月歩で高くなっています。こうしたソフトを使うことで、自動でテープ起こしをしてくれます。しかも、無料ソフトも多数登場しています。
ただ、音声の状態を良好に保つなど、一定の条件を満たさないと正確なテキスト化がされません。音声認識ソフトによるAIテープ起こしに慣れるまで、人によっては時間を要するでしょう。
当サイト「音声書き起こし専門オフィス」は、音声文字化の専門業者である佐藤編集事務所が運営しております。
当オフィスのスタッフによる、書き起こし・テープ起こしに関するブログです。