
「AIを使って、録音したファイルの文字起こし作業を楽にしたい」

「Googleが提供する文字起こしAIのサービスはないのかな?」
インタビューや講演会の録音データを、AIを使って文字起こしができれば作業もスムーズに進みます。
AIを使って文字起こしをするなら、Googleが提供する「Speech-to-Text」が使いやすくておすすめです。
Googleが提供するサービスだから信用できる上に、アカウントの取得も簡単で快適に使えます。
本記事では「Speech-to-Text」で使用できる機能や、使い方を紹介します。
インタビュー記事や議事録の作成をする際に「Speech-to-Text」の文字起こし機能を使って効率化を進めましょう。
文字起こし以外にもさまざまなAI活用術を知りたいなら、ぜひ「わどAIスクール」公式LINEを友だち追加してください。

AIを使って業務を効率化する方法や、新たに収入の得るための資料が無料で受け取れます。


Googleが提供するAI文字起こし機能「Speech-to-Text」

Googleが提供するAI文字起こし機能「Speech-to-Text」を紹介します。
「Speech-to-Text」は、下記の点から文字起こしを便利で安全に使えます。
- 録音データだけでなくストリーミング音声の文字起こしにも対応
- 125の広範な言語(変種)に対応している
- データ利用の規制がかけられるので企業利用時のセキュリティも問題なし
「Speech-to-Text」は、毎月400万文字まで無料で使えるダウンロード不要のアプリケーションです。
Googleアカウントがあれば利用できるため、気になった方は下のリンクより使ってください。
録音データだけでなくストリーミング音声の文字起こしにも対応

「Speech-to-Text」は、録音データはもちろん、ストリーミング音声の文字起こしもできます。
録音や動画データをダウンロードすると容量が重くなるため、ストリーミング動画をインターネット上から直接、文字起こしができると便利です。
また、マイクから受信した音声の文字起こしもリアルタイムでできるため、大幅な作業時間の短縮につなげられます。
125の広範な言語(変種)に対応している

「Speech-to-Text」は、125の言語(変種)に対応しており、翻訳業務に役立ちます。
従来は文字起こしできる言語が限られていましたが、「Speech-to-Text」ならスムーズに指定の言語へ翻訳可能です。
海外情報のキャッチアップなど、翻訳を含む文字起こし作業にかかる時間が大幅に短縮できます。
データ利用の規制がかけられるので企業利用時のセキュリティも問題なし
有料版である「Speech-to-Text API v2」を導入すれば、初期設定でセキュリティと規制に関する機能を追加した状態で利用できます。
社外秘などの機密情報を扱った会議の文字起こしをする場合には、セキュリティ対策は必須です。
セキュリティ面のリスクを減らすためにも「Speech-to-Text API v2」の導入が推奨されます。
GoogleのAI文字起こし「Speech-to-Text」の使い方

「Speech-to-Text」を使う手順は、下記のとおりです。
- 「Google Cloud」にアクセスして[Speech] を選択する
- [音声文字変換] を選択してプロジェクトを作成する
- [Transcriptions] を使ってストレージから変換する音声ファイルを選択する
- 音声文字変換のオプションを更新する
- 音声文字変換用にファイルを送信する
それぞれの手順を、詳しく説明します。
1.「Google Cloud」にアクセスして[Speech] を選択する
まずは、「Google Cloud」へアクセスします。下の図の赤で囲った「Speech」を選択してください。

2.[音声文字変換] を選択してプロジェクトを作成する
次に、下の図の赤で囲った「音声文字変換を作成」をクリックしてください。

APIが有効になっていない場合は、先に「APIを有効にする」を選択して有効にしましょう。
3.[Transcriptions] を使ってストレージから変換する音声ファイルを選択する
ワークスペースを作成し、「音声ファイル」にチェックが入っていると、右側に「音声ファイルを選択」の文章が出てきます。

その下の窓から翻訳したい音声ファイルを選択してください。
4.音声文字変換のオプションを更新する
下の画像の赤で囲った部分を入力していきます。音声言語は、日本語なら「Japanese(japan)-ja-JP」を選択してください。

5.音声文字変換用にファイルを送信する
最後に「続行」をクリックして、切り替わった画面で「送信」を押してください。

下の画面に切り替わるので、ファイル名をクリックすると、文字起こしをダウンロードできる画面に切り替わります。


最初は無料でクレジットがもらえるため、無料で文字起こしができます。
その後、クレジットがなくなったときに課金が発生しないよう、クリーンアップしながら使いましょう。
「Speech-to-Text」にはAI文字起こし以外に嬉しい機能も付帯

「Speech-to-Text」には、動画に字幕をつける機能がついています。
流れる動画へ同時に字幕をつけられるため、「自分で動画を楽しむとき」「間違っている字幕を目視で確認したいとき」などに便利です。

この機能を使えば、動画編集に必要な字幕を入れる作業の大幅に短縮できます。
また、Googleはテキストを音声データに変換する「Text-to-Speech」を提供しています。これにより、自然な合成音声データへの変換が可能です。
動画コンテンツを作成する際に、自分の声を使いたくない場合には使用するといいでしょう。
動画編集にAIを活用する方法は、下記の記事で詳しく解説しています。動画編集でAIを活用したいと考えている方は、ぜひご確認ください。
「Speech-to-Text」以外にもGoogleには便利なAI文字起こし機能がある

Googleには、「Speech-to-Text」以外にも、下記のAI文字起こし機能があります。
- 【無料】Googleドキュメントの音声入力(文字起こし)
- 【無料】Google AI Studioの音声文字起こし
- 【有料】Google Meetの文字起こし・議事録作成
それぞれの機能を、詳しく解説します。
【無料】Googleドキュメントの音声入力(文字起こし)
「Googleドキュメント」を使えば、無料で音声の文字起こしが可能です。
登録不要で手軽に使える点がメリットといえるでしょう。
単に文章を作成したいとき、Googleドキュメントへ声で入力することも可能です。音声入力を活用すれば、タイピングの負担も軽減できます。
ただし、専門用語や社内用語が使われているときには、うまくテキストに変換されないことがあるため注意が必要です。
【無料】Google AI Studioの音声文字起こし
「Google AI Studio」では、生成AIを利用した文字起こしが可能です。
「Google AI Studio」に音声ファイルをアップロードしながら、プロンプト(指示文)を入れると、文字起こしの文章を出力できます。
プロンプトの例は「添付の音声ファイルを、すべて文字起こししてください」などです。
「あのー」や「えー」などの音声ならではの言葉まで文字起こししてしまう点は、デメリットといえるでしょう。

追加で「口語体ではなく文章体に変換してください」といった指示を出すと改善されます。
手軽に無料で利用できるため、音声データから文字起こしする際には、活用してください。
【有料】Google Meetの文字起こし・議事録作成
「Google Meet」の文字起こし機能と、Googleの有料版AI「Gemini 2.5 Pro」を組み合わせて利用するのも手です。
「Google Meet」の文字起こしは「録音環境や発音によって品質が変わる」「専門用語が正確に表せない」などの懸念点があります。

そのまま使用するのは難しいですが、「Gemini 2.5 Pro」と組み合わせて使用することで改善されます。
出力された文字起こしを「Gemini 2.5 Pro」に入力し、精度の高いデータへ変換すると使いやすい内容に仕上がります。
文字起こしを「Gemini 2.5 Pro」で変換する際に組み込むのがおすすめなプロンプトは下記のとおりです。
- 文字起こしのミスを正すこと
- 読みやすい文体に変えること
- 議題ごとに発言内容を整理すること
- 「あのー」といった不要な言葉を省くこと
変換された文字起こしのデータに合わせた指示を出し、その後の作業で使いやすい内容に改善してください。
GoogleのAI文字起こし機能を使う際の注意点

GoogleのAI文字起こし機能を使う際には、下記の3点に注意しましょう。
- 文字起こしには誤字脱字などのミスがある前提で使う
- 一度に変換できる音声データ量・回数には制限が出る場合がある
- 機密情報を扱う際にはAI文字起こし機能の使用可否・設定をよく検討する
それぞれの注意点を詳しく説明します。
文字起こしには誤字脱字などのミスがある前提で使う
AIによる文字起こしには、誤字脱字などのミスが出る場合がほとんどです。

文字起こしのデータを外部に提出する際には、確認をしてAIによるミスを正してから渡しましょう。
インタビュー記事の作成といった、個人で使用する際には、誤字脱字を完全になくす必要はありません。
ただし、AIの生成した内容に、ハルシネーションと呼ばれる、事実と異なる情報が入っている場合は修正する必要があります。
ハルネーションが含まれていると、嘘の情報を発表してしまう恐れがあるため、内容の信ぴょう性を確認してください。
一度に変換できる音声データ量・回数には制限が出る場合がある
契約中の料金プランに応じて使えるデータ量・回数に制限がある場合があります。無料プランの場合には、回数制限があることが多いので、特に注意してください。
一日に何度も文字起こしを使用する場合は、有料プランの導入を検討しましょう。
機密情報を扱う際にはAI文字起こし機能の使用可否・設定をよく検討する
機密情報を扱う案件で使用する場合、AIでの文字起こしを使用していいかどうか検討が必要です。
クライアントからの案件なら、AIを使った文字起こしを使用していいか確認しておきましょう。
AIには、学習機能がある場合がほとんどです。文字起こしに使用したデータも、AIに蓄積される可能性があります。
「使用許可できる情報か」「学習機能の設定は問題ないか」などを見直した上でAIを使用してください。
GoogleのAI文字起こし以外に使えるAIツールとは?

GoogleのAI文字起こし機能以外のツールを、以下にまとめています。
ツール名 | 料金 | 汎用性 | 特徴 |
---|---|---|---|
ChatGPT | 一部有料 | △ | 一般的によく使われているAIツールです。文字起こしにも対応していますが、動画・音声データの入力はできません。 「Whisper」といった音声認識システムとの連携が必要です。 |
Notion AI | 一部有料 | × | Notionが提供するAIツールで、月20回まで無料で使用できます。 直接文字起こしをする機能は備わっていないため「Googleドキュメント」で文字起こしした文章を整えるような、補助的な使い方をしましょう。 |
tl;dv | 無料 | 〇 | 無料で無制限に会議の文字起こしができます。 議事録に特化したツールなので、会議の文字起こしに使用するなら「tl;dv」を選べば間違いないでしょう。 |
toruno | 有料 | 〇 | 法人の場合、3週間(上限30時間)までなら無料トライアルが利用できますが、日常的に使うなら有料版に入らなければなりません。 文字起こしに特化しているため、汎用性は高いといえます。 |
Notta | 無料 | 〇 | 「Notta」は、完全に無料で使える文字起こしサービスです。 インタビューや商談、セミナー、会議など幅広い分野の文字起こしで、使い勝手のいいAIツールです。 |
それぞれの特徴を理解し、作業内容に合ったAIツールを選びましょう。
AIツールの基本は「ChatGPT」です。「ChatGPT」の使い方の詳細は、下記の2記事を参考にしてください。
GoogleのAI文字起こし機能を使いこなして業務を効率よく進めましょう

インタビュー記事の作成や会議の議事録作成など、さまざまな業務においてAIの文字起こしができれば時間の短縮につながります。
Googleが提供する「Speech-to-Text」は「録音データやストリーミング音声にも対応」「125の広範な言語(変種)に対応」などの点から、文字起こしに使いやすいツールです。
Googleのアカウントがあれば無料で使用できるため、すぐに利用できます。「Speech-to-Text」を効果的に使って、作業時間の短縮につなげましょう。
AIツールには、ほかにも作業時間を短縮する使い方が多くあります。
下記のリンクから「わどAIスクール」公式LINEを友だち追加すると、生成AIのさまざまな利用方法を無料で配布しています。

ぜひ下記のリンクから友だち追加してください。
