Contents
“言語コード”(ISO639)とは?
HTMLとXML文書でテキストまたは他の項目の言語を示すために使用されます。世界各地の名称をアルファベットで規定した国際規格のことであり、国際標準化機構が発行しています。多言語でのWebサイト構築時やアプリの開発時には言語をデータベースに格納しますが、その際に使用される略号のことです。HTMLで”言語タグ”の指定はlang属性を使用し、XMLではxml:lang属性を使用します。一般的には「ISO639-1」と呼ばれる”言語コード”が使用されますが、「ISO639-2」や、「ISO639-3」などいくつか種類もございます。また、地方語や方言まで表現する場合は”言語サブタグ”を使用することもございます。今回はローカライズ会社の視点で、多言語Webサイトの構築やアプリ開発時における”言語コード”または”言語サブタグ”をご紹介いたします。
世界中で使用されている言語数
さて、”言語コード”や”言語サブタグ”のご紹介の前に、現在地球上で使用されている言語の数はご存知でしょうか?2023年現在、世界には200ほどの国と地域が存在します。世界中の言語数は言語学者によって数え方は様々ですが、3,000から7,000くらいだろうと言われています。このように言語数については正式な数が不明であり、国や地域の数と言語数が一致していません。このことから、世界的にみて1つの国や地域で話される言語は1言語ではないことが一般的とされています。
公用語は一つではないことが多い
以上のことから、日本のように公用語が一つしかない国や地域は世界でも珍しく30%ほどと言われております。上記でご紹介したとおり、一般的には一つの国や地域で話されている言語はいくつかございます。このように、公用語が3つとされている「ルクセンブルク」出身の社員へ言語について社内インタビューを行いました。
幼少期の語学学習について教えてください。
家庭ではルクセンブルク語を話します。小学校からドイツ語とフランス語を学んで、中学校から英語を学びます!
ルクセンブルクでの言語の使い分けを教えてください。
公文書には主にフランス語が使われ、日常ではルクセンブルク語が一般的に使われます。
ルクセンブルク語の特徴を教えてください。
ルクセンブルク語とは、ドイツ語の方言を国語として整備したものでドイツ語に似ています。
あなたはどの言語を話せますか?
話せる言語はルクセンブルク語、ドイツ語、フランス語、英語、ポルトガル語と日本語です!
同じ言語に見えて話す言葉は様々
次に、南米でもスペイン語が話されていることをご存知の方も多いと思いますが、同じスペイン語に聞こえて実際に話している言葉は違うことが多々あるのはご存知でしょうか。また、スペイン語を話すとされている地域は主に、スペイン、アルゼンチン、ボリビア、チリ、コロンビア、コスタリカ、ドミニカ共和国、エクアドル、エルサルバドル、ガテマラ、ホンジュラス、メキシコ、ニカラグア、パナマ、パラグアイ、ペルー、プエルトリコ、ウルグアイ、ベネズエラとして一般的に認知されています。そんなローカライズ時には必要になる(地方語)ですが、実際の違いをご紹介。(※アルゼンチン、メキシコのみ)
例えば、Tシャツという単語をスペイン語に翻訳すると‥
スペインでは:Camiseta(カミセタ)
アルゼンチンでは:Remera(レメラ)
メキシコでは:Playera(プラジェラ)
ちなみに、メキシコでTシャツとされる”Playera”ですが、スペインのスペイン語ではビーチサンダルとして話されることもあるそうです。というのも、スペイン語で”Playa”がビーチを意味する単語であり、ゆえにメキシコではビーチが派生し「ビーチに行くような軽装のこと」を表したものとして”Playera”として使用されるようになったのかも知れません。
これらのことを踏まえて多言語でのWebサイト構築時や、アプリ開発時には対象地域の1言語のみならず、どの地域に向けてどんなターゲットなのか?
“言語コード”と”言語サブタグ”の種類
それでは、”言語コード”や”言語サブタグ”の概要をご紹介します。最初に少しご紹介しましたが、これらにはいくつか種類があります。また、Webサイトの構築時にローカライズを重要視し、地方語や方言も表示させる場合は”言語サブタグ”を使用し「拡張」「言語」「用字」「領域」「変種」「拡張」などを定義して表示させることがあります。
●言語コード
ISO639-1
例)日本語:ja、英語:en、中国語:zh等
一般的に使用されている2文字のアルファベットコード。現在200程度の言語が国際規格として定義されています。
ISO639-2
例)日本語:jpn、英語:eng、中国語:chi(B), zho(T)等
3文字のアルファベットからなるコード。550程度の言語が国際規格として定義されています。
ISO639-2には、bibliographic(B)とterminology(T)の2種類のコードが定義されています。
ISO639-3
3文字のアルファベットからなるコード。知られるすべての自然言語の網羅を目的として、7900程度の言語が国際規格として定義されています。
ただし、言語学者によって再建されたインド・ヨーロッパ祖語などの言語は含まないとされています。
●言語サブタグ
拡張言語サブタグ
例)zh-yue(中国の広東語)→yue 等
拡張言語サブタグは、’extlang’サブタグとも呼ばれます。拡張言語サブタグは、常に特定の主要言語サブタグの後に付けなければならず、使用可能な言語タグは1つもしくは、2つ以上で定義することができます。主要言語+拡張言語の組み合わせは、古い言語タグ形式に対応するために提供されており、各主要言語+拡張言語の組み合わせに対して利用可能な単一の言語サブタグがあります。できるだけ主要言語+拡張言語の組み合わせではなく、単一の言語サブタグを使用し短く記述したほうが良いとされています。
用字サブタグ
例)zh-Hans (中国/簡体字)
用字サブタグは、RFC 4646で初めて導入されました。用字サブタグは1つの言語タグに使用することができ、必ず言語または拡張サブタグの直後に続きます。
領域サブタグ
例)zen-GB (イギリス英語)
RFC3066の領域サブタグは、ISO3166国コードから値を採用しました。 これらの2文字コードは新しいレジストリからなおも利用可能ですが、レジストリは3桁のUN M.49リージョンコードも記載します。このコードの利点は、国以上を表すことができることです。ローカライズにおいて必要である地域別の地方言語を表示することが可能です。
異形サブタグ
例)sl-nedis (スロベニア語のNadiza方言)
異形サブタグは、方言または言語、用字および領域サブタグの組み合わせでカバーできない、方言を示すために使用されるサブタグです。基本的には言語または領域サブタグの後に出現しなければなりませんが、必ずしも用字と領域サブタグが異形サブタグの前に出現させなければならないとは限りません。
“言語コード”や”言語タグ”一覧(希少言語や地方語も含む)
それでは、実際に言語を表示する際に使用される”言語コード”や”言語タグ”を一覧にてご紹介。また、ローカライズ会社ならではの地方語も記載。
(異形サブタグを省略※一部抜粋 / a-z順)
言語コード(サブタグ) | 日本語名 |
is | アイスランド語 |
ga | アイルランド語 |
af | アフリカ語 |
ar | アラビア語 |
sq | アルバニア語 |
it | イタリア語 |
it-ch | イタリア語 (スイス) |
id | インドネシア語 |
uk | ウクライナ語 |
uz | ウズベク語 |
et | エストニア語 |
ca | カタロニア |
gl | ガリシア |
km | カンボジア語;クメール語 |
ky | キルギス語 |
ku | クルド語 |
hr | クロアチア語 |
gd | ゲール語 |
kg | コンゴ語 |
jv | ジャワ語 |
ka | ジョージア語 |
sv | スウェーデン語 |
sv | スウェーデン語 |
sv-se | スウェーデン語 (スウェーデン) |
sv-fi | スウェーデン語 (フィンランド) |
es-uy | スペイン語 (ウルグアイ) |
es-ec | スペイン語 (エクアドル) |
es-sv | スペイン語 (エルサルバドル) |
es-gt | スペイン語 (ガテマラ) |
es-cr | スペイン語 (コスタリカ) |
es-co | スペイン語 (コロンビア) |
es-cl | スペイン語 (チリ) |
es-do | スペイン語 (ドミニカ共和国) |
es-ni | スペイン語 (ニカラグア) |
es-pa | スペイン語 (パナマ) |
es-py | スペイン語 (パラグアイ) |
es-pr | スペイン語 (プエルトリコ) |
es-ve | スペイン語 (ベネズエラ) |
es-pe | スペイン語 (ペルー) |
es-bo | スペイン語 (ボリビア) |
es-hn | スペイン語 (ホンジュラス) |
es-mx | スペイン語 (メキシコ) |
es-ar | スペイン語(アルゼンチン) |
es | スペイン語(スペイン) |
sk | スロバキア語 |
sk | スロバキア語 |
sl | スロベニア |
sw | スワヒリ語 |
sr | セルビア |
sr | セルビア語 |
so | ソマリ語 |
th | タイ語 |
tl | タガログ語 |
cs | チェコ語 |
bo | チベット語 |
da | デンマーク語 |
de | ドイツ語 |
de-at | ドイツ語 (オーストリア) |
de-ch | ドイツ語 (スイス) |
de-li | ドイツ語 (リヒテンシュタイン) |
de-lu | ドイツ語 (ルクセンブルグ) |
tk | トルクメン語 |
tr | トルコ語 |
ne | ネパール語 |
no | ノルウェー語 |
eu | バスク語 |
haw | ハワイ |
hu | ハンガリー語;マジャル語 |
my | ビルマ語;ミャンマー語 |
hi | ヒンディー語 |
fi | フィンランド語 |
fo | フェロー諸島 |
fr | フランス語 |
fr-ca | フランス語 (カナダ) |
fr-ch | フランス語 (スイス) |
fr-fr | フランス語 (フランス) |
fr-be | フランス語 (ベルギー) |
fr-mc | フランス語 (モナコ) |
fr-lu | フランス語 (ルクセンブルグ) |
bg | ブルガリア |
vi | ベトナム語 |
he | ヘブライ語 |
fa | ペルシア語 |
pl | ポーランド語 |
pt | ポルトガル語 |
pt-br | ポルトガル語(ブラジル) |
pt-pt | ポルトガル語(ヨーロッパ) |
mk | マケドニア |
mt | マルタ語 |
ms | マレー語 |
la | ラテン語 |
lv | ラトビア語 |
lt | リトアニア語 |
ro | ルーマニア語 |
ro-mo | ルーマニア語 (モルドバ) |
ro-ro | ルーマニア語 (ルーマニア) |
lb | ルクセンブルク語 |
rw | ルワンダ語 |
ru | ロシア語 |
ru-mo | ロシア語 (モルドバ) |
en | 英語 |
en-ie | 英語 (アイルランド) |
en-jm | 英語 (ジャマイカ) |
en-tt | 英語 (タイ) |
en-nz | 英語 (ニュージーランド) |
en-ph | 英語 (フィリピン) |
en-bz | 英語 (ベリーズ) |
en-za | 英語 (南アフリカ) |
en-us | 英語(アメリカ) |
en-gb | 英語(イギリス) |
en-au | 英語(オーストラリア) |
en-ca | 英語(カナダ) |
ko | 韓国語 |
el | 現代ギリシア語 |
zh | 中国語 |
zh-cn | 中国語(簡体字) |
zh-yue | 中国語(広東語) |
zh-tw | 中国語(繁体字) |
ja | 日本語 |
Microsoft社の言語コード一覧ページ『国/地域コードおよび言語コード』
https://help.bing.microsoft.com/#apex/bing/ja/10004/-1
“多言語Webサイトの構築”や”Webサイトの翻訳”はお任せください!
弊社ではローカライズ事業のみならず、Webサイト制作も行っております。日本語のみならず多言語での制作経験があり、またWebサイトの翻訳も多くご依頼頂いております。
クリエイティブ実績
https://www.activegamingmedia.com/index.php/portfolio-category/creative/
また、Webサイトの構築や翻訳では、弊社多言語ネイティブの社員による、より自然なテキストやご希望のニュアンスに合わせた文脈での翻訳が可能です。
例)丁寧な文脈
例)フランクで親しみやすい文脈
例)少し砕けたユニークな文脈
など、お客様と綿密なヒアリングを行い、ローカライズ会社ならではのニーズに合わせた翻訳の表現を得意としております!
“言語コード”や”言語サブタグ”、その他ご質問もお気軽に!
多言語Webサイトの構築や運用に関するご質問や、その他ローカライズに関するご質問もお気軽にお問い合わせください。 「ホームページを多言語化したいけどそこまで大きく予算が取れない。」「提供サービスのターゲットエリアに合わせた言語でランディングページを公開したい。」など、様々なお悩みがあると思います。そんなお悩みもぜひお気軽にご相談ください。また、お見積りも無料で行っております!