「ISO 639-3」の版間の差分
en:ISO 639-3 oldid=625218815 を翻訳 タグ: サイズの大幅な増減 |
|||
1行目: | 1行目: | ||
{| class="wikitable" width="25%" align="right" |
|||
#REDIRECT [[ISO 639]] |
|||
! 言語検索 |
|||
|- |
|||
| style="text-align:center" | ISO 639-3 コードを入力して対応する言語の記事を表示 |
|||
|- |
|||
|<inputbox> |
|||
type=search |
|||
width=10 |
|||
default=ISO 639: |
|||
buttonlabel=表示 |
|||
searchbuttonlabel=検索 |
|||
break=no |
|||
</inputbox> |
|||
|} |
|||
'''ISO 639-3:2007''' ''Codes for the representation of names of languages — Part 3: Alpha-3 code for comprehensive coverage of languages'' は、国際規格 [[ISO 639]] [[言語コード]]のひとつであり、[[国際標準化機構]]によって2007年2月5日に公刊された<ref name="ISO status">{{cite web|url=http://www.iso.org/iso/en/CatalogueDetailPage.CatalogueDetail?CSNUMBER=39534&ICS1=1&ICS2=140&ICS3=20 |title=ISO 639-3 status and abstract |publisher=iso.org |date=2010-07-20 |accessdate=2012-06-14}}</ref>。 |
|||
ISO 639-3 は [[ISO 639-2]] 3文字コードの拡張で、知られるすべての[[自然言語]]をカバーすることを目的とする。拡張された言語の範囲は主に ISO 639-3 の[[登録主体]]になっている<ref>{{cite web | title = Maintenance agencies and registration authorities | url = http://www.iso.org/iso/home/standards_development/list_of_iso_technical_committees/maintenance_agencies.htm | publisher = ISO |accessdate=2012-06-14}}</ref>[[国際SIL]]の出版物である[[エスノローグ]]の言語コードを元にしている。ISO 639-3 は、その言語が現存の言語であるか消滅言語・古代語・人工言語であるかを問わず、使用者の数を問わず、書かれた記録があるかどうかを問わず、可能なかぎり完全な言語の一覧を提供する<ref name="ISO status" />。ただし、[[インド・ヨーロッパ祖語]]のような[[再建]]された言語は含まない<ref>{{cite web|url=http://www.sil.org/iso639-3/types.asp#A |title=Types of individual languages - Ancient languages |publisher=sil.org |date= |accessdate=2012-06-14}}</ref>。 |
|||
ISO 639-3 はさまざまな応用に供することを目的とする。計算機と情報システムでは、インターネットのように多言語を支援する必要のあるため、広く使われる。また、言語学の文献その他において、言語名では不明瞭であったり多義的であったりする場合に、それを補うために使われる。 |
|||
ISO 639-3 は言語を包括的にカバーし、すべての言語に等しい機会を与え、情報技術で広く採用されているため、[[情報格差]]の問題に対応するための重要な技術を提供する。 |
|||
== 言語コード == |
|||
ISO 639-3 は、[[ISO 639-1]] で定義されている(世界の文献でもっとも頻繁に使われる )すべての言語を含んでいる。ISO 639-2 は言語だけでなく複数の言語グループにもコードを与えているが、ISO 639-3 はそうではないため、ISO 639-3 は ISO 639-2 の上位集合ではない。また、ISO 639-2 にはBコードとTコードの2種類があるが、ISO 639-3 はTコードを使用している。 |
|||
例: |
|||
{| class=wikitable |
|||
|- |
|||
!言語||639-1||639-2 (B/T)||639-3<br/>型||639-3<br/>コード |
|||
|- |
|||
|[[英語]]||en||eng||individual ||eng |
|||
|- |
|||
|[[ドイツ語]]||de||ger/deu||individual||deu |
|||
|- |
|||
|rowspan=2|[[アラビア語]]||rowspan=2|ar||rowspan=2|ara||macro||ara |
|||
|- |
|||
|individual||arb + その他 |
|||
|- |
|||
|[[中国語]]||rowspan=4|zh||rowspan=4|chi/zho<ref name="ethnologue">[http://archive.ethnologue.com/14/show_iso639.asp?code=zho Ethnologue report for ISO 639 code: zho] on ethnologue.com</ref>{{,}}<ref>[http://www-01.sil.org/iso639-3/macrolanguages.asp ISO639-3] on SIL.org</ref>||macro||zho |
|||
|- |
|||
|[[官話|北方語]]||individual||cmn |
|||
|- |
|||
|[[広東語]]||individual||yue |
|||
|- |
|||
|[[閩南語]]||individual||nan |
|||
|} |
|||
2012年4月の段階で、ISO 639-3 には 7,776 の言語を含んでいる<ref name="Data-Files">{{cite web|url=http://www-01.sil.org/iso639-3/download.asp |title=ISO 639-3 Code Set |publisher=Sil.org |date=2007-10-18 |accessdate=2012-06-14}}</ref>。 |
|||
ISO 639-3 に含まれる言語には以下のものを含む: 639-2 の単独の言語、[[エスノローグ]]に記述された現代語、{{仮リンク|Linguist List|en|Linguist List}}に記述された歴史的な変種・古代語・[[人工言語]]<ref>{{cite web|url=http://www-01.sil.org/iso639-3/default.asp |title=ISO 639-3 |publisher=sil.org|accessdate=2012-06-14}}</ref>、および毎年のコメント期間中に推奨された言語。 |
|||
機械可読なデータファイルが登録主体によって提供されている<ref name="Data-Files"/>。このデータファイルを使用して ISO 639-1 または ISO 639-2 から ISO 639-3 への変換を行うことができる。 |
|||
ISO 639-3 は原則として、主観的でない基準に従って言語の区別を行う<ref>{{cite web|url=http://www-01.sil.org/iso639-3/scope.asp#I |title=Scope of Denotation: Individual Languages |publisher=sil.org|accessdate=2012-06-14}}</ref>。方言その他の言語未満の変種について識別子を与えることを目的としない<ref>{{cite web|url=http://www-01.sil.org/iso639-3/scope.asp#Dialects |title=Scope of Denotation: Dialects |publisher=sil.org|accessdate=2012-06-14}}</ref>。しかし言語の区別には主観がはいりこみ得る。とくに文字で書かれたり教育やメディアで使用されたりすることによる様式化が進んでいない口頭言語の変種の場合は特にその傾向が高い。 |
|||
== コード空間 == |
|||
ISO 639-3 のコードはアルファベット3文字であるため、格納できる言語の最大値は 26 × 26 × 26 = 17576 である。ISO 639-2 は4つの特殊コード・520の予備コード・23のBのみのコードを含んでいるため、ISO 639-3 では 547 のコードを使用することができない。したがって、17576 - 547 = 17030 が最大値となる。 |
|||
ISO 639-2 の言語グループ名のうち [[ISO 639-5]] に定義されていないものを除くと、さらにその数は少なくなる。 |
|||
== マクロランゲージ == |
|||
{{Main|ISO 639 マクロランゲージ}} |
|||
ISO 639-2 のうち56の言語は、ISO 639-3 では標準の目的において「マクロランゲージ」と考えられている<ref>{{cite web|url=http://www.sil.org/iso639-3/scope.asp#M |title=Scope of denotation: Macrolanguages |publisher=sil.org |date= |accessdate=2012-06-14}}</ref>。 |
|||
これらの[[マクロランゲージ]]のうち、いくつかは ISO 639-2 のうちに個別言語を全く含んでおらず(例: ara アラビア語)、ISO 639-3 で新たに定義された。他のマクロランゲージである nor (ノルウェー語)については、ISO 639-2 のうちにすでに2つの個別言語を含んでいる(nno [[ニーノシュク]] および nob [[ブークモール]])。 |
|||
このことは、ISO 639-2 である言語(例: ara アラビア語)の方言と見なされていた言語(例: arb 標準アラビア語)が、ISO 639-3 では個別言語と見なされてることがあることを意味する。 |
|||
マクロランゲージは、言語学的には異なる言語であるが、話者にとっては同じ言語の2つの変種として扱われる場合(例: [[ダイグロシア]]の場合)を扱うための試みである。 |
|||
例: |
|||
* http://www.sil.org/iso639-3/documentation.asp?id=ara (アラビア語全般、639-2) |
|||
* http://www.sil.org/iso639-3/documentation.asp?id=arb (標準アラビア語、639-3) |
|||
完全なマクロ言語の一覧は以下を参照: {{cite web|url=http://www.sil.org/iso639-3/macrolanguages.asp |title=Macrolanguage Mappings |publisher=sil.org |date= |accessdate=2012-06-14}} |
|||
== 集合的言語 == |
|||
{{See also|ISO 639-2#言語グループコード}} |
|||
集合的言語コード要素とは、いかなる文脈においても単一の言語と考えられない、個別言語のグループを表す識別子である<ref>{{cite web|url=http://www.sil.org/iso639-3/scope.asp#C |title=Scope of denotation: Collective languages |publisher=sil.org |date= |accessdate=2012-06-14}}</ref> 。これらのコードは個別言語でもマクロランゲージでもない。 |
|||
ISO 639-2 には集合的言語のための3文字識別子が含まれるが、ISO 639-3 からは除外されている。したがって、ISO 639-3 は ISO 639-2 の上位集合ではない。 |
|||
[[ISO 639-5]] は語族や語派のための集合的コードを定義している。 |
|||
== 汎用コード == |
|||
特定のコードのいずれも妥当でない場合のために、4つのコードが定義されている。これらのコードは、主にデータベースのように、ISO コードが存在しなくても指定しなければならない場合に使用することを目的とする。 |
|||
{|class=wikitable |
|||
|- |
|||
|mis ||その他の言語 |
|||
|- |
|||
|mul ||複数言語 |
|||
|- |
|||
|und ||不明言語 |
|||
|- |
|||
|zxx ||言語ではない |
|||
|} |
|||
<code>mis</code> (miscellaneous の略に由来)は、ISO標準に(まだ)含まれていない言語のために用いる。 |
|||
<code>mul</code> は、データが複数の言語からなるが、データベースが単一のISOコードを指定することを要求しているときに用いる。 |
|||
<code>und</code> は、データに使用されている言語名が不明である(誤ってラベルづけされている、ラベルづけされていないなど)場合に用いる。[[トロイ|トロイ語]]のように、言語名は存在するが言語そのものが不明である場合に使用することは目的としていない。 |
|||
<code>zxx</code> は、データが言語でない場合(動物の鳴き声など)に用いる<ref>[http://www.ldc.upenn.edu/Catalog/catalogEntry.jsp?catalogId=LDC2004S12 Field Recordings of Vervet Monkey Calls]. Entry in the catalog of the [http://www.ldc.upenn.edu Linguistic Data Consortium]. Retrieved 2012-09-04.</ref>。 |
|||
以上に加えて、<code>qaa–qtz</code> の範囲はローカルに使用する場合のために予約されている。たとえば{{仮リンク|Linguist List|en|Linguist List}} で消滅した言語のために用いる。Linguist List ではこのうちひとつに汎用の値を割りあてている。 |
|||
{|class=wikitable |
|||
|- |
|||
|qnp ||名前のない祖語 |
|||
|} |
|||
このコードは、言語系統図において名前のない節点を表すのに使われる。 |
|||
== 保守のプロセス == |
|||
ISO 639-3 のコード表は変更可能であるが、すでに使われているコードを守るため、変更が許されるのは以下の場合に限られる:<ref>{{cite web|url=http://www-01.sil.org/iso639-3/submit_changes.asp#Types |title=Submitting ISO 639-3 Change Requests: Types of Changes |publisher=sil.org|accessdate=2012-06-14}}</ref> |
|||
* ある項目に対する参照情報の変更(言語名・型や範囲の分類を含む) |
|||
* 項目の追加 |
|||
* 重複または誤った項目を非推奨にすること |
|||
* ある項目を別の項目に併合すること |
|||
* 既存の項目を複数の新しい項目に分割すること |
|||
変更は年1回行われる。各変更要求は最低3か月の公開レビュー期間が与えられる。 |
|||
ISO 639-3 のサイトの「命名の範囲」<ref>{{cite web|url=http://www-01.sil.org/iso639-3/scope.asp |title=Scope of Denotation for Language Identifiers |publisher=sil.org|accessdate=2012-06-14}}</ref><!--([[wikt:en:languoid|languoid]]の型)--> およびSILの言語の型<ref>{{cite web|url=http://www-01.sil.org/iso639-3/types.asp |title=Types of Languages |publisher=sil.org|accessdate=2012-06-14}}</ref>において、コードを与える範囲と、どのような条件を満たさなければならないかを説明している。たとえば、人工言語に識別子を与えることはできるが、それが人間のコミュニケーションのために設計されており、かつ文献がある場合に限られる。この制約は個々人の発明に対する要求がなされることを防ぐためにある。 |
|||
登録主体のWebサイトでは、ISO 639-3 のコード表がどのように保守されるかついて説明している<ref>{{cite web|url=http://www-01.sil.org/iso639-3/changes.asp |title=ISO 639-3 Change Management |publisher=sil.org |accessdate=2012-06-14}}</ref>。同時に、変更要求を受けとり処理するためのプロセスも記述している<ref>{{cite web|url=http://www-01.sil.org/iso639-3/submit_changes.asp |title=Submitting ISO 639-3 Change Requests |publisher=sil.org|accessdate=2012-06-14}}</ref>。 |
|||
このWebサイトでは変更要求の書式と、追加提案に関する情報を収集するための第二の書式が提供されている。任意の団体が変更要求を提出できる。提出された要求はまず登録主体によって不備がないかレビューされる。 |
|||
不備のない文書による要求を受けとった場合、その要求が公開されている「変更要求インデックス(Change Request Index)」に加えられる。同時にLingust List の LINGUISTディスカッション・リストおよび関連すると登録主体がみなしている他のリストに告知がなされ、変更要求に対する公開レビューに招待する。どのリストのオーナーおよび個人も特定の地域や語族に関する変更要求に関する通知を受け取ることができる。受け取ったコメントは他の団体がレビューするために公開される。コメントの総意にもとづいて、変更要求は撤回されるか、または「候補状態(candidate status)」に昇格する。 |
|||
毎年のレビュー期間が終了する3か月前に、LINGUIST のディスカッション・リストおよび他のリストに、「候補状態の変更要求(Candidate Status Change Requests)」に関する告知がなされる。すべての要求は、レビュー期間が終了するまでレビュー・コメントが可能である。 |
|||
毎年のレビュー期間の終了時に決定がなされる。要求は全体あるいは一部が採用されるか、修正されて翌年に持ちこされるか、または検討が撤回される。各変更要求と、それに対する決定・決定の根拠の公開アーカイブが保守されている<ref>{{cite web|url=http://www-01.sil.org/iso639-3/chg_requests.asp |title=ISO 639-3 Change Request Index |publisher=sil.org|accessdate=2012-06-14}}</ref>。 |
|||
== 批判 == |
|||
言語学者のモーリー、ポストおよびフリードマンは ISO 639-3 に対してさまざまな批判を提起している<ref name="Morey-Post-Friedman">{{cite conference | title = The language codes of ISO 639: A premature, ultimately unobtainable, and possibly damaging standardization | last1 = Morey | first1 = Stephen | last2 = Post | first2 = Mark W. | last3 = Friedman | first3 = Victor A. | year = 2013 | conference = PARADISEC RRR Conference | url = http://hdl.handle.net/2123/9838 }}</ref>。 |
|||
* 3文字コード自身に問題がある。これらのコードは公式には恣意的で技術的なラベルとされているが、実際にはしばしば言語名の省略からなっており、そのうちいくつかは差別的である。たとえば、{{仮リンク|イェム語|en|Yemsa}}には jnj が割りあてられているが、これは差別語の「Janejero」に由来する。これらのコードはその言語の話者を侮辱するものであるが、標準において割り当てを変更することができない。 |
|||
* 標準の管理に問題がある。SIL はキリスト教の宣教団体であり、透明性や説明責任において不適当である。何が言語としてコード化するに値するかの決定が内部で行われる。外部の提案は歓迎されたりされなかったりするが、決定自身は不透明であり、多くの言語学者が標準を改訂することを諦めている。 |
|||
* 言語に恒久的な識別子を与えることは、言語の変化と両立しない。 |
|||
* 言語と方言はしばしば厳格に区別できない。[[方言連続体]]はさまざまな区分が可能である。そのような区分はしばしば社会的・政治的要因によってなされる。 |
|||
* ISO 639-3 は人々の所属に関する決定を行う権力者によって誤解ないし誤用され、言語の話者が自分の所属を決めたり自分の言語が何であるかを決めたりする権利を奪いかねない。SIL はこのような問題に対して注意を払ってはいるものの、確立した標準には本質的にこの問題をかかえており、ISO や SIL の意図しない方向に使われる(または誤用される)可能性がある。 |
|||
{{仮リンク|マーティン・ハスペルマート|en|Martin Haspelmath}} はこの指摘のうちの4つを認めたが、言語変化については認めなかった<ref name=Haspelmath>Martin Haspelmath, [http://dlc.hypotheses.org/610 "Can language identity be standardized? On Morey et al.'s critique of ISO 639-3"], ''Diversity Linguistics Comment'', 2013/12/04</ref>。ハスペルマートによれば、どのような言語の記述もそれが何の言語であるかを同定することが必要であるし、言語の異なる段階を区別するのは容易であるから、言語変化に関する指摘は不当なものである。ハスペルマートは、言語学者は [[wikt:en:languoid|languoid]] レベルのコード化を行うことを好むだろうとする。「言語学者にとって、それが言語であるか、方言であるか、緊密な関係にある複数の言語であるかが意味を持つことはほとんどない」ためである。ハスペルマートはまた、ISO が言語の同定を行うことが妥当かにも疑問を投げかける。ISO は工業規格の機関であるが、言語の文献と用語は科学的な努力であるとする。ハスペルマートは言語コードの本来の必要性は「翻訳と[[国際化と地域化|ローカライズ]]の経済的重要性」にあり、ISO 639-1 と ISO 639-2 はそのために作られたことを指摘する。しかし ISO 639-3 によって提供されるような「狭いコミュニティーで使われ、全くないしほとんど書かれることのない、しばしば絶滅の危機にある、ほとんど知られていない言語」を含む包括的なコードが工業的に必要かどうかは疑問とする。 |
|||
== 使用例 == |
|||
* [[エスノローグ]] |
|||
* [[Linguist List]] |
|||
* [[OLAC]] (Open Languages Archive Community) |
|||
* [[IETF言語タグ]] |
|||
* [[Lexical Markup Framework]](機械可読辞書を表現するための国際標準) |
|||
* Proposed as language TLD (lcTLD)<ref>{{cite web|url=http://www.circleid.com/posts/languages_in_the_root_a_tld_launch_strategy_based_on_iso_639 |title=Languages in the Root: A TLD Launch Strategy Based on ISO 639 |publisher=Circleid.com |date=2004-10-05 |accessdate=2012-06-14}}</ref><ref>{{cite web|url=http://forum.icann.org/lists/gtld-strategy-draft/msg00005.html |title=ICANN Email Archives: [gtld-strategy-draft] |publisher=Forum.icann.org |date= |accessdate=2012-06-14}}</ref> |
|||
* Unicode の [[Common Locale Data Repository|CLDR]] (ISO 639-2 に含まれない数百の言語について ISO 639-3 を使用) |
|||
* [[Microsoft Windows 8]]<ref>{{cite web|url=http://blogs.windows.com/windows/b/windowsexperience/archive/2014/02/05/over-7-000-languages-just-1-windows.aspx |title=Over 7,000 languages, just 1 Windows |publisher=Microsoft |date=2014-02-05 |accessdate=2014-10-20}}</ref> (公開時の ISO 639-3 のすべてのコードをサポート) |
|||
== 脚注 == |
|||
{{reflist}} |
|||
== 関連文献 == |
|||
* {{cite journal |
|||
| title = ISO standardized language codes and the Ethnologue |
|||
| journal = SSILA Bulletin | volume = 247 | year = 2006 |
|||
| first = Anthony | last = Aristar |
|||
| url = http://linguistlist.org/ssila/Bulletins/Archive/bull247.pdf |
|||
}} |
|||
* {{cite journal |
|||
| title = Practical language development: Whose mission? |
|||
| first1 = Lise M. | last1 = Dobrin | first2 = Jeff | last2 = Good |
|||
| journal = Language | volume = 85 | number = 3 | year = 2009 | pages = 619–629 |
|||
| doi = 10.1353/lan.0.0152 |
|||
| url = http://www.acsu.buffalo.edu/~jcgood/DobrinGood-PracticalLanguageDevelopment.pdf |
|||
}} |
|||
* {{cite journal |
|||
| title = In opposition to adopting Ethnologue's language codes for ISO 639-3 |
|||
| journal = SSILA Bulletin | volume = 246 | year = 2006 |
|||
| first = Patience, et al | last = Epps |
|||
| url = http://linguistlist.org/ssila/Bulletins/Archive/bull246.pdf |
|||
}} |
|||
* {{cite journal |
|||
| title = SSILA statement on ISO 639-3 language codes |
|||
| journal = SSILA Bulletin | volume = 249 | year = 2006 |
|||
| editor-first = Victor | editor-last = Golla |
|||
| url = http://linguistlist.org/ssila/Bulletins/Archive/bull249.pdf |
|||
}} |
|||
== 外部リンク == |
|||
* '''[http://www.sil.org/iso639-3/ ISO 639-3 Registration Authority]''' |
|||
* [[アメリカ議会図書館]]サイトの [http://www.loc.gov/standards/iso639-2/faq.html FAQ] |
|||
* [http://www.sil.org/iso639-3/chg_requests.asp?order=lang_grp&chg_status=current Pending ISO 639-3 applications] |
|||
* [http://linguistlist.org/forms/langs/GetListOfAncientLgs.html Linguist List - List of Ancient and Extinct Languages] |
|||
* [http://eikenes.alvestrand.no/pipermail/ietf-languages/2003-November/001589.html {{lang|no|Håvard Hjulstad}} による解説] |
|||
{{Footer ISO 639}} |
|||
<!-- {{ISO standards}} --> |
|||
{{DEFAULTSORT:Iso 639-3}} |
|||
[[Category:ISO 639]] |
|||
[[Category:識別子]] |
|||
[[de:ISO 639#ISO 639-3]] |
2014年10月20日 (月) 20:31時点における版
言語検索 |
---|
ISO 639-3 コードを入力して対応する言語の記事を表示 |
ISO 639-3:2007 Codes for the representation of names of languages — Part 3: Alpha-3 code for comprehensive coverage of languages は、国際規格 ISO 639 言語コードのひとつであり、国際標準化機構によって2007年2月5日に公刊された[1]。
ISO 639-3 は ISO 639-2 3文字コードの拡張で、知られるすべての自然言語をカバーすることを目的とする。拡張された言語の範囲は主に ISO 639-3 の登録主体になっている[2]国際SILの出版物であるエスノローグの言語コードを元にしている。ISO 639-3 は、その言語が現存の言語であるか消滅言語・古代語・人工言語であるかを問わず、使用者の数を問わず、書かれた記録があるかどうかを問わず、可能なかぎり完全な言語の一覧を提供する[1]。ただし、インド・ヨーロッパ祖語のような再建された言語は含まない[3]。
ISO 639-3 はさまざまな応用に供することを目的とする。計算機と情報システムでは、インターネットのように多言語を支援する必要のあるため、広く使われる。また、言語学の文献その他において、言語名では不明瞭であったり多義的であったりする場合に、それを補うために使われる。
ISO 639-3 は言語を包括的にカバーし、すべての言語に等しい機会を与え、情報技術で広く採用されているため、情報格差の問題に対応するための重要な技術を提供する。
言語コード
ISO 639-3 は、ISO 639-1 で定義されている(世界の文献でもっとも頻繁に使われる )すべての言語を含んでいる。ISO 639-2 は言語だけでなく複数の言語グループにもコードを与えているが、ISO 639-3 はそうではないため、ISO 639-3 は ISO 639-2 の上位集合ではない。また、ISO 639-2 にはBコードとTコードの2種類があるが、ISO 639-3 はTコードを使用している。
例:
言語 | 639-1 | 639-2 (B/T) | 639-3 型 |
639-3 コード |
---|---|---|---|---|
英語 | en | eng | individual | eng |
ドイツ語 | de | ger/deu | individual | deu |
アラビア語 | ar | ara | macro | ara |
individual | arb + その他 | |||
中国語 | zh | chi/zho[4] · [5] | macro | zho |
北方語 | individual | cmn | ||
広東語 | individual | yue | ||
閩南語 | individual | nan |
2012年4月の段階で、ISO 639-3 には 7,776 の言語を含んでいる[6]。
ISO 639-3 に含まれる言語には以下のものを含む: 639-2 の単独の言語、エスノローグに記述された現代語、Linguist Listに記述された歴史的な変種・古代語・人工言語[7]、および毎年のコメント期間中に推奨された言語。
機械可読なデータファイルが登録主体によって提供されている[6]。このデータファイルを使用して ISO 639-1 または ISO 639-2 から ISO 639-3 への変換を行うことができる。
ISO 639-3 は原則として、主観的でない基準に従って言語の区別を行う[8]。方言その他の言語未満の変種について識別子を与えることを目的としない[9]。しかし言語の区別には主観がはいりこみ得る。とくに文字で書かれたり教育やメディアで使用されたりすることによる様式化が進んでいない口頭言語の変種の場合は特にその傾向が高い。
コード空間
ISO 639-3 のコードはアルファベット3文字であるため、格納できる言語の最大値は 26 × 26 × 26 = 17576 である。ISO 639-2 は4つの特殊コード・520の予備コード・23のBのみのコードを含んでいるため、ISO 639-3 では 547 のコードを使用することができない。したがって、17576 - 547 = 17030 が最大値となる。
ISO 639-2 の言語グループ名のうち ISO 639-5 に定義されていないものを除くと、さらにその数は少なくなる。
マクロランゲージ
ISO 639-2 のうち56の言語は、ISO 639-3 では標準の目的において「マクロランゲージ」と考えられている[10]。
これらのマクロランゲージのうち、いくつかは ISO 639-2 のうちに個別言語を全く含んでおらず(例: ara アラビア語)、ISO 639-3 で新たに定義された。他のマクロランゲージである nor (ノルウェー語)については、ISO 639-2 のうちにすでに2つの個別言語を含んでいる(nno ニーノシュク および nob ブークモール)。
このことは、ISO 639-2 である言語(例: ara アラビア語)の方言と見なされていた言語(例: arb 標準アラビア語)が、ISO 639-3 では個別言語と見なされてることがあることを意味する。
マクロランゲージは、言語学的には異なる言語であるが、話者にとっては同じ言語の2つの変種として扱われる場合(例: ダイグロシアの場合)を扱うための試みである。
例:
- http://www.sil.org/iso639-3/documentation.asp?id=ara (アラビア語全般、639-2)
- http://www.sil.org/iso639-3/documentation.asp?id=arb (標準アラビア語、639-3)
完全なマクロ言語の一覧は以下を参照: “Macrolanguage Mappings”. sil.org. 2012年6月14日閲覧。
集合的言語
集合的言語コード要素とは、いかなる文脈においても単一の言語と考えられない、個別言語のグループを表す識別子である[11] 。これらのコードは個別言語でもマクロランゲージでもない。
ISO 639-2 には集合的言語のための3文字識別子が含まれるが、ISO 639-3 からは除外されている。したがって、ISO 639-3 は ISO 639-2 の上位集合ではない。
ISO 639-5 は語族や語派のための集合的コードを定義している。
汎用コード
特定のコードのいずれも妥当でない場合のために、4つのコードが定義されている。これらのコードは、主にデータベースのように、ISO コードが存在しなくても指定しなければならない場合に使用することを目的とする。
mis | その他の言語 |
mul | 複数言語 |
und | 不明言語 |
zxx | 言語ではない |
mis
(miscellaneous の略に由来)は、ISO標準に(まだ)含まれていない言語のために用いる。
mul
は、データが複数の言語からなるが、データベースが単一のISOコードを指定することを要求しているときに用いる。
und
は、データに使用されている言語名が不明である(誤ってラベルづけされている、ラベルづけされていないなど)場合に用いる。トロイ語のように、言語名は存在するが言語そのものが不明である場合に使用することは目的としていない。
zxx
は、データが言語でない場合(動物の鳴き声など)に用いる[12]。
以上に加えて、qaa–qtz
の範囲はローカルに使用する場合のために予約されている。たとえばLinguist List で消滅した言語のために用いる。Linguist List ではこのうちひとつに汎用の値を割りあてている。
qnp | 名前のない祖語 |
このコードは、言語系統図において名前のない節点を表すのに使われる。
保守のプロセス
ISO 639-3 のコード表は変更可能であるが、すでに使われているコードを守るため、変更が許されるのは以下の場合に限られる:[13]
- ある項目に対する参照情報の変更(言語名・型や範囲の分類を含む)
- 項目の追加
- 重複または誤った項目を非推奨にすること
- ある項目を別の項目に併合すること
- 既存の項目を複数の新しい項目に分割すること
変更は年1回行われる。各変更要求は最低3か月の公開レビュー期間が与えられる。
ISO 639-3 のサイトの「命名の範囲」[14] およびSILの言語の型[15]において、コードを与える範囲と、どのような条件を満たさなければならないかを説明している。たとえば、人工言語に識別子を与えることはできるが、それが人間のコミュニケーションのために設計されており、かつ文献がある場合に限られる。この制約は個々人の発明に対する要求がなされることを防ぐためにある。
登録主体のWebサイトでは、ISO 639-3 のコード表がどのように保守されるかついて説明している[16]。同時に、変更要求を受けとり処理するためのプロセスも記述している[17]。
このWebサイトでは変更要求の書式と、追加提案に関する情報を収集するための第二の書式が提供されている。任意の団体が変更要求を提出できる。提出された要求はまず登録主体によって不備がないかレビューされる。
不備のない文書による要求を受けとった場合、その要求が公開されている「変更要求インデックス(Change Request Index)」に加えられる。同時にLingust List の LINGUISTディスカッション・リストおよび関連すると登録主体がみなしている他のリストに告知がなされ、変更要求に対する公開レビューに招待する。どのリストのオーナーおよび個人も特定の地域や語族に関する変更要求に関する通知を受け取ることができる。受け取ったコメントは他の団体がレビューするために公開される。コメントの総意にもとづいて、変更要求は撤回されるか、または「候補状態(candidate status)」に昇格する。
毎年のレビュー期間が終了する3か月前に、LINGUIST のディスカッション・リストおよび他のリストに、「候補状態の変更要求(Candidate Status Change Requests)」に関する告知がなされる。すべての要求は、レビュー期間が終了するまでレビュー・コメントが可能である。
毎年のレビュー期間の終了時に決定がなされる。要求は全体あるいは一部が採用されるか、修正されて翌年に持ちこされるか、または検討が撤回される。各変更要求と、それに対する決定・決定の根拠の公開アーカイブが保守されている[18]。
批判
言語学者のモーリー、ポストおよびフリードマンは ISO 639-3 に対してさまざまな批判を提起している[19]。
- 3文字コード自身に問題がある。これらのコードは公式には恣意的で技術的なラベルとされているが、実際にはしばしば言語名の省略からなっており、そのうちいくつかは差別的である。たとえば、イェム語には jnj が割りあてられているが、これは差別語の「Janejero」に由来する。これらのコードはその言語の話者を侮辱するものであるが、標準において割り当てを変更することができない。
- 標準の管理に問題がある。SIL はキリスト教の宣教団体であり、透明性や説明責任において不適当である。何が言語としてコード化するに値するかの決定が内部で行われる。外部の提案は歓迎されたりされなかったりするが、決定自身は不透明であり、多くの言語学者が標準を改訂することを諦めている。
- 言語に恒久的な識別子を与えることは、言語の変化と両立しない。
- 言語と方言はしばしば厳格に区別できない。方言連続体はさまざまな区分が可能である。そのような区分はしばしば社会的・政治的要因によってなされる。
- ISO 639-3 は人々の所属に関する決定を行う権力者によって誤解ないし誤用され、言語の話者が自分の所属を決めたり自分の言語が何であるかを決めたりする権利を奪いかねない。SIL はこのような問題に対して注意を払ってはいるものの、確立した標準には本質的にこの問題をかかえており、ISO や SIL の意図しない方向に使われる(または誤用される)可能性がある。
マーティン・ハスペルマート はこの指摘のうちの4つを認めたが、言語変化については認めなかった[20]。ハスペルマートによれば、どのような言語の記述もそれが何の言語であるかを同定することが必要であるし、言語の異なる段階を区別するのは容易であるから、言語変化に関する指摘は不当なものである。ハスペルマートは、言語学者は languoid レベルのコード化を行うことを好むだろうとする。「言語学者にとって、それが言語であるか、方言であるか、緊密な関係にある複数の言語であるかが意味を持つことはほとんどない」ためである。ハスペルマートはまた、ISO が言語の同定を行うことが妥当かにも疑問を投げかける。ISO は工業規格の機関であるが、言語の文献と用語は科学的な努力であるとする。ハスペルマートは言語コードの本来の必要性は「翻訳とローカライズの経済的重要性」にあり、ISO 639-1 と ISO 639-2 はそのために作られたことを指摘する。しかし ISO 639-3 によって提供されるような「狭いコミュニティーで使われ、全くないしほとんど書かれることのない、しばしば絶滅の危機にある、ほとんど知られていない言語」を含む包括的なコードが工業的に必要かどうかは疑問とする。
使用例
- エスノローグ
- Linguist List
- OLAC (Open Languages Archive Community)
- IETF言語タグ
- Lexical Markup Framework(機械可読辞書を表現するための国際標準)
- Proposed as language TLD (lcTLD)[21][22]
- Unicode の CLDR (ISO 639-2 に含まれない数百の言語について ISO 639-3 を使用)
- Microsoft Windows 8[23] (公開時の ISO 639-3 のすべてのコードをサポート)
脚注
- ^ a b “ISO 639-3 status and abstract”. iso.org (2010年7月20日). 2012年6月14日閲覧。
- ^ “Maintenance agencies and registration authorities”. ISO. 2012年6月14日閲覧。
- ^ “Types of individual languages - Ancient languages”. sil.org. 2012年6月14日閲覧。
- ^ Ethnologue report for ISO 639 code: zho on ethnologue.com
- ^ ISO639-3 on SIL.org
- ^ a b “ISO 639-3 Code Set”. Sil.org (2007年10月18日). 2012年6月14日閲覧。
- ^ “ISO 639-3”. sil.org. 2012年6月14日閲覧。
- ^ “Scope of Denotation: Individual Languages”. sil.org. 2012年6月14日閲覧。
- ^ “Scope of Denotation: Dialects”. sil.org. 2012年6月14日閲覧。
- ^ “Scope of denotation: Macrolanguages”. sil.org. 2012年6月14日閲覧。
- ^ “Scope of denotation: Collective languages”. sil.org. 2012年6月14日閲覧。
- ^ Field Recordings of Vervet Monkey Calls. Entry in the catalog of the Linguistic Data Consortium. Retrieved 2012-09-04.
- ^ “Submitting ISO 639-3 Change Requests: Types of Changes”. sil.org. 2012年6月14日閲覧。
- ^ “Scope of Denotation for Language Identifiers”. sil.org. 2012年6月14日閲覧。
- ^ “Types of Languages”. sil.org. 2012年6月14日閲覧。
- ^ “ISO 639-3 Change Management”. sil.org. 2012年6月14日閲覧。
- ^ “Submitting ISO 639-3 Change Requests”. sil.org. 2012年6月14日閲覧。
- ^ “ISO 639-3 Change Request Index”. sil.org. 2012年6月14日閲覧。
- ^ Morey, Stephen; Post, Mark W.; Friedman, Victor A. (2013). The language codes of ISO 639: A premature, ultimately unobtainable, and possibly damaging standardization. PARADISEC RRR Conference.
- ^ Martin Haspelmath, "Can language identity be standardized? On Morey et al.'s critique of ISO 639-3", Diversity Linguistics Comment, 2013/12/04
- ^ “Languages in the Root: A TLD Launch Strategy Based on ISO 639”. Circleid.com (2004年10月5日). 2012年6月14日閲覧。
- ^ “ICANN Email Archives: [gtld-strategy-draft]”. Forum.icann.org. 2012年6月14日閲覧。
- ^ “Over 7,000 languages, just 1 Windows”. Microsoft (2014年2月5日). 2014年10月20日閲覧。
関連文献
- Aristar, Anthony (2006). “ISO standardized language codes and the Ethnologue”. SSILA Bulletin 247 .
- Dobrin, Lise M.; Good, Jeff (2009). “Practical language development: Whose mission?”. Language 85 (3): 619–629. doi:10.1353/lan.0.0152 .
- Epps, Patience, et al (2006). “In opposition to adopting Ethnologue's language codes for ISO 639-3”. SSILA Bulletin 246 .
- Golla, Victor, ed (2006). “SSILA statement on ISO 639-3 language codes”. SSILA Bulletin 249 .