アダムスキー全集のテキストファイル化に加えて、「生命の科学」と「テレパシー」の英文対訳データベースを作成している。「生命の科学」は昨年終わって、今は「テレパシー」を進めている。
日本語訳はもちろん、久保田八郎氏の訳だが、英語の原文と照らし合わせると、別な意味が見えてくる場面も多々あるので、新しい発見がある。
この作業も、Scansnapというドキュメントスキャナとパナソニックの「読取革命」というOCRソフトのおかげで、効率よくできた。英文の場合は、日本語よりも文字が少ないので、驚くほど認識率が高く、誤認識はほとんどなかった。日本語は以前、テキストDB化したファイルがあったので、英文と日本語文を1センテンスずつに分解してセットにする作業だけでよい。
センテンスの分解は、テキストエディタ(秀丸エディタを使用)の置換機能で、正規表現を使った。
英文の場合は、「ピリオド」を「ピリオド + 改行マーク」に置き換えて、2文字以上の連続する空白を除去するだけでほぼ完了である。日本語の場合は、「。」やカギカッコを同様に処理すればよい。
今は、英語の原文と、久保田八郎氏が訳した日本語文しか対比できないけど、できればこれに加えて、その他の翻訳者の訳や、自分自身の訳も加えていった方が理解が深まると思う。
「テレパシー」が終わったらぜひ、「宇宙哲学」も対訳版を作りたいと思う。前半の方で、日本語だと意味が分からない箇所があるので、ぜひ原文を見てみたい。
残念ながら私は原文を保有していないので、それが手に入ったら、作業を進める。
コメント