不届きな素人のための映像字幕リバエン

素晴らしい切り抜き
正確には「ファウナの配信たちをアニメシーズンだと思ってよいか」
ということなんですが

本気にしないでほしいのだけど、なじみのVTuberの配信は大体の流れが予想できるので、見る側からするとアニメのようなものでもあるのだ。考えてみれば始まりも終わりも明確だし、ある程度の長さがあるし、ミュトスがある。アニメへの見立てが常に妥当だとは言わないが、さりとて不自然だとも言い切れないのは、外部的な「見え」がそうなっているからだ。星とヒトデだってある観点から見ると似ているのだから、その類似自体を否認することに正義はない。

ところでアニメというと、個人的に思い出すのは焼き込み字幕のあの質感で、これは一般には洋画に紐づいているものかもしれない。いずれにせよ、そういうイメージがVTuberの配信を見ているときにちらついたことがあったので、実際に形にしてみたらそれがとても面白かった。VTuberが話していることを自分で日本語へ翻訳して、あたかもDVDからリッピングしてきた映像のように仕立てるのだ。

She's real to me

あくまで内観的なイメージの再現なので、これがうまくいっているかどうかの判定は自分だけの関心ごとに過ぎないことを踏まえて、一応書いておくとなかなかうまくいっている。やってることはfansubっぽくもあるし、翻訳切り抜きっぽくもある、そのどっちつかずな雰囲気が気に入っている。そんなわけで、ここにひとつ自給自足のループが完成したのだった。私はこの世界をまったく豊かにすることなく死んでいくのだろう。

それで、ちらつく度に似たようなものを作っては出力しているのだが、ちょっと問題があって、焼き込み字幕の独特の質感を再現するのが少し骨だ。やってみるまでは想像もできなかったが、自分のイメージが要求してくる完成度が地味に高い。毎回即興で感覚的に作っていると失敗は避けられず、そしてそれは致命的だ。VTuberは私が無駄にした一日を待ってはくれない。となれば、パターン化できる部分だけでも(技術的な面だけに話を絞るという意味だ)、当たる率の高い方法を自分なりに確立しておくべきだ。

 


プロが仕事としてやっている映像翻訳は、自身があくまで後景となること、その存在が透明化することを理念としている。この高貴さは眩しい。この高貴さを背負い、名も無き職人として自らの仕事を全うし終え、またこれからも全うしていくだろうプロ達は眩しい。そして、素人はこの眩しさには耐えられない。それゆえ、プロ達が規準とする禁欲的な原則は、この記事においては例外なく破られ緩められる方角にずれることとなる。どのように?

映像翻訳家の仕事を見ていて特に目立つ工程はハコ書き、スポッティング、翻訳だ。大雑把に言って、ハコ書きはいまだ分節されていない台詞を字幕一枚ずつの幅(ハコ)に区切っていく作業、スポッティングはそのハコに従って映像をフレーム単位に分節する作業のことである。俯瞰すると分かるように、映像翻訳とは順を追って言葉の流れを変質させていく営みに他ならない。

YouTubeが自動で生成する字幕
「分節されていない歌と言語」ってこれのことだろ。

これらの工程は映像翻訳の文脈では峻別され、そもそも担当者が分かれたりするが、もとの文脈を離れてこの技法を私的に転用することを考える場合、峻別は大して意味をなさなくなる。たとえば、大抵のVTuberのストリームでは映画のようなカットは原理的に挟まらないので、スポッティングの重要性がやや後退する。いや、もっと根本的なことを言うと、作るのが自分一人で評価するのも自分一人なら、なし崩しにハコ書きをやりつつスポッティングをやりつつ翻訳をやればそれで済む。当たり前だ。誰が気にする? だから、素人がハコ書きと言うからといって、ハコ書きというひとつの独立した工程を踏んでいるとは思わないでほしい。それは2つキーフレームを打って前後を3コマ開けるだけのこととほぼ同義かもしれず、その仕事に特化したキーフレーム打ち師などという作業員はこの世にはいないのだ。ナット締め工員のチャーリー君もこれにはにっこり。

ナットをスパナで締める仕事

もうひとつ、土足で踏み込んだ素人の目に留まるのは、ハコ書きで大前提とされる「1秒4文字」の原則である。文字数の多い字幕が観客に負担をかけることは望ましくないから、という至極もっともな理由で制定されたルールに、素人は後足で砂をかけようとする。字幕を読むのが自分自身である分には文字の数がやや多かろうが何の仔細もない。不自然に多くなりすぎなければいいだけ、というのが素人の腹の内だ。この素人は皆の生きる世界をまったく豊かにすることなく死んでいくのだろう。私のことだ。

 


組版的な観点から眺めてみよう。映像翻訳における翻訳の要件は極めてシビアであり、その裏返しとして極めてシンプルでもある。具体的には、以下の二項目で済んでしまう;「最大2行、最大16文字/行」「句読点は使わず空白で代用する」

しかし、これだけではあんまり色気ないから、映像翻訳家は道具箱から約物や種々の装飾手段を取り出してきて台詞それ自体が持っていた生気を代補するのだ。プロの使う道具箱が美しく整理されているのに対して、素人のあつらえた道具箱は中身が雑然としている。しかもよく見ると、後から勝手に足した道具も紛れ込んでいる。

  • 先に述べたように、句読点が担うべき役割は半角空白␣をふたつ重ねることによって代わられる。見えも触れもしないものをどうやって道具箱の中から探り当てているのか?

  • 全角感嘆符!と全角疑問符?は、多用すると翻訳者の技量が疑われることになるだろうが、基本的には極めて有用な約物だ。これっきゃないという場面が誰にも必ず訪れる。

  • 話者を示すときには全角丸括弧(・)を用いる。

    (オリバー)クソッタレ

    という感じだ。この話者表示の用法に限っては最大2行の要件を破ってもよい。

    (オリバー)
    ハンドブックなんか
    クソの役にも立たない

    このような場合は行頭が揃うようにカーニングを施してやる。

  • 感嘆符や疑問符に似て、全角鉤括弧「・」も便利に使われる場合が多い。また、独自の用法として、VTuberが視聴者のコメントをそのまま読み上げてから返答する場面においては、そのことを示すためにコメントを鉤括弧で囲った上で斜体(後述)にする。場合によっては話者を示す丸括弧を用いて(コメント)と明示し、これも例外的に斜体にする。実はクォーテーション“・”もたまに使っているのだが、鉤括弧と何が違うのか私には説明できないし、この道具は捨てるべきか。

カートに入れろと言ったんだ

  • 音引きー、波ダッシュ~、中黒・については、濫用に気を付けろという他で特記に値することはない。リーダー…は三点のものを重ねず単独で用いる。二点のものをふたつ重ねて作っていた時代もあったのだが、よく考えると意味のないこだわりだったので変えた。

  • ダッシュ―を音引きと混同してはならない。映像翻訳に特有の用法として、ひとつの台詞を2枚の字幕で表示するとき、1枚目の字幕が次へと続くことの合図としてダッシュは用いられる。

    ハンドブックなんか──

    と来た後

    クソの役にも立たない

    としてやればよい。他の文字と比べて長いほうが合図としては望ましいのでふたつ重ねる。

  • 装飾的になりすぎる記号は忌避されるが、文末の単芝wだけは道具として許容している。この単芝なしには拾い上げられない要素の量は驚異的だ。実際、

    (オリバー)
    ハンドブックなんか
    クソの役にも立たないw

    としてやらないことには伝わらないニュアンスがインターネットには溢れている。

以上が約物のレパートリーで、続いて挙げられるのは書式に属する装飾道具である。これらは併用してもよい。

  • 特殊な発話を表記する際はその部分を斜体にする。先ほど紹介したコメントの読み上げの他には、ゲーム内台詞の翻訳などが代表例。

  • 画面下部にどうしても邪魔になるオブジェクトがある場合には、字幕を縦書きにして右端に置くという手がある。ただし、画面右端はふつうVTuberが鎮座するための場所なので、文字数の制限が横書きのときよりもさらに厳しくなるのは仕方がない。

  • 演出上必要となる場合はルビや傍点を付してもよい。傍点は中黒で代用する。

 


映像翻訳の真似事をするにあたって最も楽しいのは、あの独特の雰囲気の字幕を偽造することだというのは分かっていただけると思う。翻訳産業ではSSTG1といった字幕制作ソフトが使われているのだが、素人はそんなものを使っている場合ではないので、偽造にあたっては多少の産業スパイ行為に臆していてはいけない。素人のマインドセットはここに至って初めて独特の輝きを帯び出す。そういう意味では、使用するソフトウェアを事細かに指定したくはないし、びた一文払うもんかという心意気こそが予後を思うと望ましいのだが、見栄えのことを考慮に入れるとカーニング機能はどうしても必要で、それだけでかなりの数の手頃なアプリが候補から消えることとなる。少なくともMSペイントでは苦戦を強いられるだろう。

マスオさん、タクシーのワイパーに着想を得て
「自動ダイコンおろし器」を開発する男
産業スパイを最も恐れるのは産業スパイだ

フォントはFOT-UD丸ゴ_スモール Pr6N DB(有料フォントだ!)で、和欧混植の類はやらない。アートボードのサイズをフルHDにする前提なら、フォントサイズは60ptに設定し、最下行のベースラインの中点が(960, 985)に来るよう配置する。極めてconfusingだ。以下の画像をダウンロードして目視で位置を揃えたほうが早い。字間や行間の設定はデフォルトのままいじらないでおこう。デフォルトって何だよ?

横書きの実例
この画像をダウンロードして目視で位置を揃えよう

ストロークの設定にはやや注意しなくてはならない。そのまま太いストローク黒を入れてしまうと、字体の白地が消えてしまって見にくいから、これを防ぐためにストローク黒10pt(センター塗り)の上へ塗り白を重ねるようにする。このような操作を単一テキストオブジェクトだけで完結させられるソフトウェアでない場合は、ストローク部分と塗り部分でテキストオブジェクトを分けてやればよい。

ややこしいのが書式の装飾である。まずルビと傍点だが、フォントのウェイトをM、サイズを32ptに変更したうえで、座標を上か下のほうへずらす。どの程度ずらすかは本当に適当というか、これも目視だ。

ルビと傍点を打った例
行間と字間は目で見て揃えている

斜体にしてやりたい場合は大抵ニセ斜体(オブリーク体のことですな)で用が済む。のだけど、ときどき「おれが見てきた映像字幕の斜体は傾き方がもっときつくはなかったか?」という疑問がよぎることがあり、こうなるとおしまいだ。画像編集ソフトで丁寧にシアー変形を施してやらねばならない羽目になる。

左がオブリーク体で右がイラレのシアー変形

ますます話が胡乱になるのは縦書きにしたいときだ。1行目のテキストボックスの上端のy座標が100に、1行目のベースラインのx座標が1750に来るように配置する。意味不明だとは思いませんか? 画像で確認したほうが百倍明快だ。行間は72ptにしておきます。

縦書き

いま何も言わず縦書きと斜体を併用した例も貼ってしまった。この形にするためには必ず画像編集ソフトでシアー変形してやらねばならない。なぜかって、オブリーク体にすると全然違うのだ。見てもらうと分かる。

斜体が正しく設定されず苦しむ家畜番

最後に、モザイクを使って字幕の解像度を二分の一に落とす。私の内観的なイメージでは、映像字幕というのは映像に比べてどこかジャギジャギしているものだからだ。最近の字幕は昔ほどジャギっていない気もするが、それはそれだ。幸運を祈る。