Iso/Iec Jtc1/Sc2/Wg2 N5148 L2/20-266

ISO/IEC JTC1/SC2/WG2 N5148 L2/20-266 2020-10-03 Universal Multiple-Octet Coded Character Set International Organization for Standardization Organisation Internationale de Normalisation Международная организация по стандартизации Doc Type: Working Group Document Title: Consolidated code chart including proposed phonetic and medieval characters Source: Michael Everson and Kirk Miller Status: Individual Contribution Action: For consideration by JTC1/SC2/WG2 and UTC Date: 2020-01-03 The charts attached present the recommended code positions for a number of documents related to the addition of IPA, phonetic, and medievalist characters to the repertoire. Cells marked in yellow indicate characters which the script ad-hoc has not formally approved as of this date. 1 1AB0 Combining Diacritical Marks Extended 1AFF 1AB 1AC 1AD 1AE 1AF 0 1 $᫁ 1AC1 2 $᫂ 1AC2 3 $᫃ 1AC3 4 $᫄ 1AC4 5 $᫅ 1AC5 6 $᫆ 1AC6 7 $᫇ 1AC7 8 $᫈ 1AC8 9 $᫉ 1AC9 A $᫊ 1ACA B $᫋ 1ACB C $ᫌ 1ACC D $ᫍ 1ACD E F Printed using UniBook™ Printed: 04-Oct-2020 2 (http://www.unicode.org/unibook/) 1AC1 Combining Diacritical Marks Extended 1ACD IPA characters for disordered speech 1AC1 $᫁ COMBINING LEFT PARENTHESIS ABOVE LEFT → 1ABB $᪻ combining parentheses above 1AC2 $᫂ COMBINING LEFT PARENTHESIS ABOVE RIGHT 1AC3 $᫃ COMBINING LEFT PARENTHESIS BELOW LEFT → 1ABD $᪽ combining parentheses below 1AC4 $᫄ COMBINING LEFT PARENTHESIS BELOW RIGHT Additional diacritics 1AC5 $᫅ COMBINING SQUARE BRACKETS ABOVE 1AC6 $᫆ COMBINING NUMBER SIGN 1AC7 $᫇ COMBINING INVERTED DOUBLE ARCH ABOVE • used over letters with a descender → 032B ̫ combining inverted double arch below 1AC8 $᫈ COMBINING PLUS SIGN ABOVE → 031F ̟ combining plus sign below Diacritics for the Middle English Ormulum 1AC9 $᫉ COMBINING TRIPLE ACUTE ACCENT → 0308 ̈ combining double acute accent 1ACA $᫊ COMBINING LATIN SMALL LETTER INSULAR G → 1D79 ᵹ latin small letter insular g 1ACB $᫋ COMBINING LATIN SMALL LETTER INSULAR R → A783 ꞃ latin small letter insular r 1ACC $ᫌ COMBINING LATIN SMALL LETTER INSULAR T → A787 ꞇ latin small letter insular t Medieval abbreviation mark 1ACD $ᫍ COMBINING OVERCURL • used in medieval Cornish, English, and Scots • used either as an abbreviation or an otiose mark → 0305 ̅ combining overline → 0311 ̑ combining inverted breve Printed using UniBook™ Printed: 04-Oct-2020 3 (http://www.unicode.org/unibook/) 2E00 Supplemental Punctuation 2EFF 2E0 2E1 2E2 2E3 2E4 2E5 2E6 2E7 2E8 2E9 2EA 2EB 2EC 2ED 2EE 2EF 0 1 2 3 ⹓ 2E53 4 ⹔ 2E54 5 6 7 8 9 A B C D E F Printed using UniBook™ Printed: 04-Oct-2020 4 (http://www.unicode.org/unibook/) 2E53 Supplemental Punctuation 2E54 Medieval punctuation 2E53 ⹓ PUNCTUS EXCLAMATIVUS MARK 2E54 ⹔ PUNCTUS INTERROGATIVUS MARK Printed using UniBook™ Printed: 04-Oct-2020 5 (http://www.unicode.org/unibook/) A720 Latin Extended-D A7FF A72 A73 A74 A75 A76 A77 A78 A79 A7A A7B A7C A7D A7E A7F 0 Ꟑ A7D0 1 ꟑ A7D1 2 ꟒ ꟲ A7D2 A7F2 3 ꟓ ꟳ A7D3 A7F3 4 ꟔ ꟴ A7D4 A7F4 5 ꟕ A7D5 6 Ꟗ A7D6 7 ꟗ A7D7 8 Ꟙ A7D8 9 ꟙ A7D9 A B Ɤ A7CB C Ꟍ A7CC D E F Printed using UniBook™ Printed: 04-Oct-2020 6 (http://www.unicode.org/unibook/) A7CB Latin Extended-D A7F4 Additional letters A7CB Ɤ LATIN CAPITAL LETTER THETA → 0398 Θ greek capital letter theta → 03F4 ϴ greek capital theta symbol A7CC Ꟍ LATIN SMALL LETTER THETA → 03B8 θ greek small letter theta → 03D1 ϑ greek theta symbol Letters for the Middle English Ormulum A7D0 Ꟑ LATIN CAPITAL LETTER CLOSED INSULAR G A7D1 ꟑ LATIN SMALL LETTER CLOSED INSULAR G → 1D79 ᵹ latin small letter insular g A7D2 ꟒ LATIN CAPITAL LETTER DOUBLE THORN A7D3 ꟓ LATIN SMALL LETTER DOUBLE THORN → 00FE þ latin small letter thorn A7D4 ꟔ LATIN CAPITAL LETTER DOUBLE WYNN A7D5 ꟕ LATIN SMALL LETTER DOUBLE WYNN → 01BF ƿ latin small letter wynn Letters for Middle Scots A7D6 Ꟗ LATIN CAPITAL LETTER MIDDLE SCOTS S A7D7 ꟗ LATIN SMALL LETTER MIDDLE SCOTS S → 00DF ß latin small letter sharp s Letters for medieval palaeography A7D8 Ꟙ LATIN CAPITAL LETTER SIGMOID S A7D9 ꟙ LATIN SMALL LETTER SIGMOID S → 017F ſ latin small letter long s → 03C3 σ greek small letter sigma Modifier letters A7F2 ꟲ MODIFIER LETTER CAPITAL C • used as a tone letter in Chatino A7F3 ꟳ MODIFIER LETTER CAPITAL F • used as a tone letter in Chatino A7F4 ꟴ MODIFIER LETTER CAPITAL Q • indicates geminate consonants Printed using UniBook™ Printed: 04-Oct-2020 7 (http://www.unicode.org/unibook/) 10780 Latin Extended-F 107BF 1078 1079 107A 107B 0 10780 10790 107A0 107B0 1 10781 10791 107A1 107B1 2 10782 10792 107A2 107B2 3 10783 10793 107A3 107B3 4 10784 10794 107A4 107B4 5 10785 10795 107A5 107B5 6 10786 10796 107A6 107B6 7 10787 10797 107A7 107B7 8 10788 10798 107A8 107B8 9 10789 10799 107A9 107B9 A 1078A 1079A 107AA 107BA B 1078B 1079B 107AB C 1078C 1079C 107AC D 1078D 1079D 107AD E 1078E 1079E 107AE F 1078F 1079F 107AF Printed using UniBook™ Printed: 04-Oct-2020 8 (http://www.unicode.org/unibook/) 10780 Latin Extended-F 107B5 Voice Quality Symbol (VoQS) 1079B MODIFIER LETTER SMALL L WITH BELT ≈ <super> 026C ɬ 10780 MODIFIER LETTER SMALL CAPITAL AA 1079C MODIFIER LETTER SMALL CAPITAL L WITH → A732 Ꜳ latin capital letter aa BELT Modifier letters for the IPA ≈ <super> 1DF04 1079D MODIFIER LETTER SMALL L WITH RETROFLEX 10781 MODIFIER LETTER SUPERSCRIPT TRIANGULAR HOOK AND BELT COLON ≈ <super> 02D0 ː ≈ <super> A78E ꞎ 1079E MODIFIER LETTER SMALL LEZH 10782 MODIFIER LETTER SUPERSCRIPT HALF TRIANGULAR COLON ≈ <super> 026E ɮ ≈ <super> 02D1 ˑ 1079F MODIFIER LETTER SMALL LEZH WITH RETROFLEX HOOK 10783 MODIFIER LETTER SMALL AE ≈ <super> 00E6 æ ≈ <super> 1DF05 10784 MODIFIER LETTER SMALL CAPITAL B 107A0 MODIFIER LETTER SMALL TURNED Y ≈ <super> 0299 ʙ ≈ <super> 028E ʎ 10785 MODIFIER LETTER SMALL B WITH HOOK 107A1 MODIFIER LETTER SMALL TURNED Y WITH ≈ <super> 0253 ɓ BELT 10786 MODIFIER LETTER SMALL LATIN BETA ≈ <super> 1DF06 ≈ <super> A7B5 ꞵ 107A2 MODIFIER LETTER SMALL O WITH STROKE → 1D5D ᵝ modifier letter small beta ≈ <super> 00F8 ø 10787 MODIFIER LETTER SMALL DZ DIGRAPH 107A3 MODIFIER LETTER SMALL CAPITAL OE ≈ <super> 02A3 ʣ ≈ <super> 0276 ɶ 10788 MODIFIER LETTER SMALL DZ DIGRAPH WITH 107A4 MODIFIER LETTER SMALL CLOSED OMEGA RETROFLEX HOOK ≈ <super> 0277 ɷ ≈ <super> AB66 ꭦ 107A5 MODIFIER LETTER SMALL Q 10789 MODIFIER LETTER SMALL DZ DIGRAPH WITH ≈ <super> 0071 q CURL 107A6 MODIFIER LETTER SMALL TURNED R WITH ≈ <super> 02A5 ʥ LONG LEG 1078A MODIFIER LETTER SMALL DEZH DIGRAPH ≈ <super> 027A ɺ ≈ <super> 02A4 ʤ 107A7 MODIFIER LETTER SMALL TURNED R WITH 1078B MODIFIER LETTER SMALL D WITH TAIL LONG LEG AND RETROFLEX HOOK ≈ <super> 0256 ɖ ≈ <super> 1DF08 1078C MODIFIER LETTER SMALL D WITH HOOK 107A8 MODIFIER LETTER SMALL R WITH TAIL ≈ <super> 0257 ɗ ≈ <super> 027D ɽ 1078D MODIFIER LETTER SMALL D WITH HOOK AND 107A9 MODIFIER LETTER SMALL R WITH FISHHOOK TAIL ≈ <super> 027E ɾ ≈ <super> 1D91 ᶑ 107AA MODIFIER LETTER SMALL CAPITAL R 1078E MODIFIER LETTER SMALL REVERSED E ≈ <super> 0280 ʀ ≈ <super> 0258 ɘ 107AB MODIFIER LETTER SMALL TC DIGRAPH WITH 1078F MODIFIER LETTER SMALL CLOSED REVERSED CURL OPEN E ≈ <super> 02A8 ʨ ≈ <super> 026E ɮ 107AC MODIFIER LETTER SMALL TS DIGRAPH 10790 MODIFIER LETTER SMALL FENG DIGRAPH ≈ <super> 02A6 ʦ ≈ <super> 02A9 ʩ 107AD MODIFIER LETTER SMALL TS DIGRAPH WITH 10791 MODIFIER LETTER SMALL RAMS HORN RETROFLEX HOOK ≈ <super> 0264 ɤ ≈ <super> AB67 ꭧ 10792 MODIFIER LETTER SMALL CAPITAL G 107AE MODIFIER LETTER TESH DIGRAPH ≈ <super> 0262 ɢ ≈ <super> 02A7 ʧ 10793 MODIFIER LETTER SMALL G WITH HOOK 107AF MODIFIER LETTER T WITH RETROFLEX HOOK ≈ <super> 0260 ɠ ≈ <super> 0288 ʈ 10794 MODIFIER LETTER SMALL CAPITAL G WITH 107B0 MODIFIER LETTER V WITH RIGHT HOOK HOOK ≈ <super> 029B ʛ ≈ <super> 2C71 ⱱ 107B1 MODIFIER LETTER LATIN CHI 10795 MODIFIER LETTER SMALL H WITH STROKE ꭓ ≈ <super> 0127 ħ ≈ <super> AB53 10796 MODIFIER LETTER SMALL CAPITAL H → 1D61 ᵡ modifier letter small chi ≈ <super> 029C ʜ 107B2 MODIFIER LETTER SMALL CAPITAL Y 10797 MODIFIER LETTER SMALL HENG WITH HOOK ≈ <super> 028F ʏ ≈ <super> 0267 ɧ 107B3 MODIFIER LETTER GLOTTAL STOP WITH STROKE 10798 MODIFIER LETTER SMALL DOTLESS J WITH STROKE AND HOOK ≈ <super> 02A1 ʡ ≈ <super> 0284 ʄ 107B4 MODIFIER LETTER REVERSED GLOTTAL STOP WITH STROKE 10799 MODIFIER LETTER SMALL LS DIGRAPH ≈ <super> 02A2 ʢ ≈ <super> 02AA ʪ 107B5 MODIFIER LETTER BILABIAL CLICK 1079A MODIFIER LETTER SMALL LZ DIGRAPH ≈ <super> 0298 ʘ ≈ <super> 02AB ʫ Printed using UniBook™ Printed: 04-Oct-2020 9 (http://www.unicode.org/unibook/) 107B6 Latin Extended-F 107BA 107B6 MODIFIER LETTER DENTAL CLICK ≈ <super> 01C0 ǀ 107B7 MODIFIER LETTER LATERAL ≈ <super> 01C1 ǁ 107B8 MODIFIER LETTER ALVEOLAR CLICK ≈ <super> 01C2 ǂ 107B9 MODIFIER LETTER RETROFLEX CLICK WITH RETROFLEX HOOK ≈ <super> 1DF0A 107BA MODIFIER LETTER LATIN THETA ≈ <super> A7CC Ꟍ → 1DBF ᶿ modifier letter small theta Printed using UniBook™ Printed: 04-Oct-2020 10 (http://www.unicode.org/unibook/) 1DF00 Latin Extended-G 1DFFF 1DF0 1DF1 1DF2 1DF3 1DF4 1DF5 1DF6 1DF7 1DF8 1DF9 1DFA 1DFB 1DFC 1DFD 1DFE 1DFF 0 1DF00 1DF10 1 1DF01 1DF11 2 1DF02 1DF12 3 1DF03 1DF13 4 1DF04 1DF14 5 1DF05 1DF15 6 1DF06 1DF16 7 1DF07 1DF17 8 1DF08 1DF18 9 1DF09 1DF19 A 1DF0A 1DF1A B 1DF0B 1DF1B C 1DF0C 1DF1C D 1DF0D E 1DF0E F 1DF0F Printed using UniBook™ Printed: 04-Oct-2020 11 (http://www.unicode.org/unibook/) 1DF00 Latin Extended-G 1DF1C IPA characters for disordered speech 1DF00 LATIN SMALL LETTER FENG DIGRAPH WITH TRILL 1DF01 LATIN SMALL LETTER REVERSED SCRIPT G 1DF02 LATIN LETTER SMALL CAPITAL TURNED G 1DF03 LATIN SMALL LETTER REVERSED K 1DF04 LATIN

Iso/Iec Jtc1/Sc2/Wg2 N5148 L2/20-266

The Unicode Cookbook for Linguists: Managing Writing Systems Using Orthography Profiles

Assessment of Options for Handling Full Unicode Character Encodings in MARC21 a Study for the Library of Congress

IPA Extensions

Font Configuration Files Supported Platforms 6-1 Loading Font Configuration Files 6-1

Journal of the International Phonetic Association

The Unicode Standard, Version 3.0, Issued by the Unicode Consor- Tium and Published by Addison-Wesley

Using the Unicode Standard for Linguistic Data: Preliminary Guidelines∗

Dejavusansmono-Bold.Ttf [Dejavu Sans Mono Bold]

Phonetic Transcription of Go

The Use of Unicode™ in MARC 21 Records What Is MARC?

The Unicode Cookbook for Linguists

IPA Extensions Range: 0250–02AF Disclaimer Fonts Terms Of