90日で韓国語マスター:YouTube字幕翻訳におすすめの生成AIサービスは?

90日で韓国語マスター 90日で韓国語マスター

韓国語学習に動画ストリーミングサービスは重要ですが、中でもYouTubeは様々な種類の会話を学べる貴重な情報源です。日本人向けに日本語字幕をつけてくれるケースも多いですが、字幕がない場合もあります。そのようなとき、字幕翻訳に役立つ生成AIサービスを比較します。

スポンサーリンク

YouTube字幕の入手方法

YouTubeで韓国のコンテンツをみるときに、日本語字幕がついていないことがあります。このようなときは、字幕をテキストでダウンロードし、翻訳サービスを活用すれば、おおよその会話の内容を把握することができます。

YouTubeの概要欄で「文字起こしを表示」をクリックすれば、右上に自動生成された韓国語が表示されますので、このテキストをコピペすれば字幕テキストを準備できます。

文字起こしを表示 文字起こしのサンプル

このコピペ作業が面倒な場合には、テキストでダウンロードしてくれるサイトもあります。

YouTube動画の字幕をダウンロードするCGI

こちらのサイトに YouTube動画のURLを入力し、「実行」ボタンを押すと、自動生成、もしくはコンテンツ作成者側で用意した字幕が表示されます。

YouTube動画の字幕テキストダウンロード

字幕翻訳に使うテキストは、”TXT”と書かれたものです。”SRT”は、タイムスタンプ付き字幕テキストで、動画の字幕をつけるときに利用します。SRT形式のファイルは、拡張子が”.srt”となっていますが、メモ帳などで開くことができます。

TXT形式 SRT形式
TXT形式 SRT形式

いずれの形式でも、文章の区切り位置が不自然になっている場合があります(特に、YouTubeで自動生成された字幕)。その場合、生成AIを活用すれば、文章の区切り位置を直しながら翻訳することができます。

字幕翻訳に優れた生成AIは?

字幕翻訳を行うには、従来型のネットの「翻訳サービス」を使う方法と、「生成AI」を使う方法があります。従来型の翻訳サービスには、Google翻訳、DeepL、Paragoなどがあります。

サービス名
字数制限
特徴
5,000文字
ほとんどの言語に対応
1,500文字(無料)
有料版は文字数上限なし
Papago(Naver)
3,000文字
16 言語(うちアジア言語 7 つ)

これら「従来型」の翻訳サービスは、与えられた文章をその通りに受け取り翻訳します。したがって元の文章に誤りがあれば、正しい翻訳文がでてくることはありません。

一方「生成AI」は、長文の文脈を理解し、もとの文章を補正することができます。翻訳性能も格段に向上しており、何千文字という長文の扱いも得意です。以前は高性能翻訳サービスといえば、「DeepL」が有名でしたが、最近のChatGPTなどは、DeepLを超える翻訳性能を出してきています。

<(従来型)翻訳サービスと生成AIの違い>

種類 具体的なサービス 特徴
(従来型)翻訳サービス Google翻訳、DeepL、Paragoなど 受け取った文章を(区切り位置もふくめ)そのまま翻訳する。
生成AI ChatGPT, Gemini, Bing など
指示の与え方(プロンプト)によっては、全体の文脈を考慮し、文章の区切り位置を直してから、翻訳することもできる。

字幕は長文になる傾向がありますが、こうした長文の翻訳に適した生成AIサービスを比較してみます。

代表的な生成AIは以下の通りです。

サービス名 提供企業 特徴
ChatGPT OpenAI 文脈を考慮した自然な文章を作成することが可能。長文の扱いも得意。
Gemini Google プログラミングや専門用語などの翻訳は得意。会話や物語などの自然な文章を生成するのはあまり得意でない。
Bing Microsoft 翻訳された文章に、ときどき不自然な表現が含まれることがある。字数制限は2,000文字程度。

ChatGPT

ChatGPT は、生成AI の代名詞ともいえる存在です。2024/5にChatGPT 4oがリリースされてから、更に日本語の文章の自然さが向上しました。無料利用の場合には、ChatGPT 4oには利用回数の制限があります。2024/7にリリースされた ChatGPT 4o-miniであれば、回数制限なく利用することができます。扱える文章の長さ上限は、128,000トークンですが、日本語のようなマルチバイト文字で 1文字1トークンと考えると、10万文字程度を扱うことができることになります。ただし、長文を渡した場合の結果出力は、100%正確ではなく、途中で文章が省略されたり、生成AIが保有している情報を勝手に書き加えることがありますので注意が必要です。あくまで経験則ですが、1,500〜2,000文字以内にとどめておくと、翻訳出力の精度が高くなる傾向があります。

Gemini

Googleが提供する生成AIサービスですが、翻訳性能はあまり高くないようです。「以下の文章を日本語に翻訳してください」と指示し、韓国語のテキストを渡しても、韓国語で回答を返すなど、おかしな動きをすることがあります。Googleの生成AIサービスは、プログラミングのコード修正などは得意ですが、自然な文章を出力するのはあまり得意ではないようです。

Bing(Copilot)

Microsoftが提供する生成AIサービス。簡単な質問であれば Bingの検索窓で対応しますが、長文の指示(プロンプト)を含む場合には、Copilotの画面にテキストを入力します。翻訳性能は悪くないですが、ChatGPTと比べてしまうと、文章の若干の不自然さが気になります。