自由に翻訳!*

エラリー ジャンクリストフ
翻訳・通訳 株式会社DOUBLET代表取締役
OmegaT 現地化管理担当/ユーザーサポート担当
問い合わせ:helaryアットマークdoubletドットjp

翻訳支援ソフトとは?

翻訳支援ソフトは翻訳メモリソフトとも呼ばれ、翻訳メモリ機能によって翻訳支援を行うソフトである。 機械(自動)翻訳との決定的な相違点は、翻訳を行うのがソフトではなく、翻訳者であることだ。翻訳メモリソフトにはいくつかの共通機能がある。

上記の「翻訳済みの分節を原文と訳文を合わせたペア」の集合、及びそれを含むデータファイルは翻訳メモリ(または翻訳メモリファイル)と呼ばれる。

上記の基本的機能に加え、ソフトによって下記のような機能も提供される。

また、原文、訳文、翻訳メモリ、用語集などのデータをまとめて効率よく扱うためには「翻訳プロジェクト」という仕組みも必要となる。

OmegaT は上記のそれぞれの機能を提供するだけでなく、使いやすさにも重点をおいたソフトである。

自由なソフトウェア

OmegaT は自分に合った環境で使用が可能だ。 Java ベースのソフトウェアであるが故に、 OS に拘らず使用できる。通常 Java 実行環境が必要となるが、Java 実行環境のないOSの場合は、Java 実行環境付きの OmegaT を使用することも可能だ。

OmegaT のもつ自由度はOSだけではない。OmegaT はまさに「自由なソフトウェア」なのだ。「自由なソフトウェア:コピー、研究、変更、配付等の扱いに関して、ほとんど、またはまったく、制限が付けられていないソフトウェア。ソースコードの開示を前提とする。」(Wikipedia、「自由なソフトウェア」)。

OmegaT の場合、使用権利は GNU GPL ライセンス(GNU 一般公衆利用許諾契約書) によって与えられる。基本的には、ソフトそのものを自由に使う権利、自由に改良する権利、変更点配布の権利があり、配布するコードに対しては、同じ権利を与える義務がある。言い換えれば、誰でも自由に使用でき、コピーや改良ができるわけである。

もう一つの OmegaT の特徴はボランティアによって開発、多言語化、テスト、サポート、普及化が進められていることである。ボランティアが中心なため、OmegaT に関わる活動もまさに自由だ。優先順は人によって異なるが、ボランティアが同時に翻訳のプロでもあるため、不完全ながら、翻訳者が求める機能を知り尽くした人々たちによって作られたわけだ。

2009年5月現在、開発管理者は4代目となり、多言語ユーザーリストの登録者数は1000人を超える。開発サイトからの平均ダウンロード数は(12ヶ月にわたって)月に4200を超えているが、殆どのLinuxディストリビューションにも入っているため、実際の使用者数は集計不可能だ。人気のあるフリーランス翻訳者の登録サイトである proz.com でも、他の翻訳支援ソフトと同様に扱われている。

OmegaT の仕組み

ここで紹介するのは OmegaT2.0.2 ベータ版である。OmegaT の開発過程には、「安定版」、「ベータ版」、「開発版」などがある。

「安定版」とは、公開時に十分に安定し、取扱説明書も更新された版である。「ベータ版」も公開時に十分に安定しているが、取扱説明書が未更新である。「開発版」は上記の二つと違った形で公開されており、開発中のためテスト用のみに使用されているが、特にアクセス制限されていないため、バイナリ構築が可能な環境さえ整えていれば普通に使える。

OmegaT が扱うのはファイルではなく、翻訳プロジェクトである。先ほど述べた様に、翻訳プロジェクトは「原文、訳文、翻訳メモリ、用語集などのデータ」を関連付けて管理する仕組みである。

OmegaT におけるこの仕組みは非常に分かりやすく、使いやすいのが特長だ。

なぜなら、それぞれのデータを関連付けるのは単純にフォルダであるからである。

新規プロジェクトを作ると、「原文」を入れるフォルダ、「翻訳メモリファイル」を入れるフォルダ、「用語集」を入れるフォルダ、そして、翻訳者が求めるときに OmegaT が訳文を入れるフォルダが作成される。

フォルダ単位なので、その中のデータが全て扱われる。つまり、原文ファイルを一つずつ訳すのではなく、原文フォルダ内のファイルを集合として扱われるので、HTML サイトなどのフォルダ階層の複雑なファイル集合も簡単に訳すことができる。

新規プロジェクトにおいて、既に存在しているフォルダを使用することも可能である。たとえば、顧客ごとにデータを整理すれば、新規プロジェクトでもその顧客用の原文フォルダや過去の参考翻訳メモリフォルダを指定することができる。翻訳プロジェクトの管理作業はOmegaTに依存することなく、Mac OS X ならばFinder、Windows では Explorer などのファイル管理ソフトで可能だ。そして、設定ファイルはすべてテキスト形式で、普通のテキストエディタで編集することもできる。

OmegaT の今

最新のベータ版では「文字列の自動テキスト出力」機能が導入された。

これは、現在の原文分節、記録された訳文分節と選択されている文字列それぞれを、別のテキストファイルへ自動的に出力する機能である。

Java コードはプログラマではない使用者にはかなり難しい。読むのも、書くのもである。従って、OmegaT の機能拡張は最近までは開発者のみが行っていた。

この新しい機能によって、bash などのシェルスクリプトやスクリプト言語の ruby、python、perl、または、単純にC言語でも、そのテキストファイルの内容を処理することで新しい拡張機能の開発が可能になる。

例えば、現在の分節を Google Translate へ送って、その訳をクリップボードに自動的に入れることで、訳文に Google の自動翻訳を参考翻訳として使える。

もう一つの「拡張機能」は原文の「見栄えタグ」の操作。例えば、原文から、タグを削除する、あるいは、原文からタグのみを残す…などの操作も可能になる。下記のスクリプトは「原文からタグのみを残す」一つの例である:

on run { }
		do shell script
		"sed \"s/<[^>]*>/ /g\" ~/Library/Preferences/OmegaT/script/source.txt | /usr/local/bin/pbcopy"
end run

sed 命令を Mac OSX の Applescript の中に入れたので、UI からそれを起動することも可能になる。

これくらいの規模の機能開発なら、ちょっとした好奇心と時間をもった方であれば行えるだろう。多言語ユーザーリストには、そういった拡張機能のコードが公開/交換/改良され、少しでもスクリプトの知識のある方ならすぐに使える。OS はそれぞれなので、共通の言語や方法が好まれるが、自分の OS で適用できない方法でも、原理さえ分かれば、数行で書き換えることができる。

API という程のものではないが、その機能によって、使用者のコンピュータリテラシーも高まるだろう。それは、自由なソフトの基本的な役割とも言える。

これから…

OmegaT は日本語化されているので、起動すれば、「お手軽スタートガイド」が表示され、そこで記述された基本操作さえ覚えればすぐに仕事で使える。取扱説明ガイドは1.6版から更新されていないままであるが、原理はそれほど変わっていないし、新しい機能はソフトのメニューから日本語で表示されるので、試せばすぐにわかる。分からないときにはユーザーリストに訊くことができる。そして、いずれ、最新版の取扱説明ガイドを日本語に訳すボランティアが現れたら…完成!

さあ、あなたも是非、OmegaT を試してみてください!

開発サイト:
https://sourceforge.net/projects/omegat/

ユーザーリスト:
http://tech.groups.yahoo.com/group/OmegaT/

オープンソースカンファレンス 2009 関西 in 京都 7月11日(土)11時15分「翻訳支援ツール OmegaT最新情報!」
http://www.ospn.jp/osc2009-kansai/


*:この記事は
AAMT ジャーナル45号に掲載されました。