diff options
Diffstat (limited to 'unicode/unicode.h')
| -rw-r--r-- | unicode/unicode.h | 134 | 
1 files changed, 133 insertions, 1 deletions
| diff --git a/unicode/unicode.h b/unicode/unicode.h index 715722a..a857fc3 100644 --- a/unicode/unicode.h +++ b/unicode/unicode.h @@ -92,12 +92,144 @@ extern uint8_t unicode_tab_lookup(unicode_char ch,  int unicode_grapheme_break(unicode_char a, unicode_char b); +typedef enum { +	/* UNICODE_SCRIPT_T */ +	unicode_script_unknown, +	unicode_script_common, +	unicode_script_latin, +	unicode_script_greek, +	unicode_script_cyrillic, +	unicode_script_armenian, +	unicode_script_hebrew, +	unicode_script_arabic, +	unicode_script_syriac, +	unicode_script_thaana, +	unicode_script_devanagari, +	unicode_script_bengali, +	unicode_script_gurmukhi, +	unicode_script_gujarati, +	unicode_script_oriya, +	unicode_script_tamil, +	unicode_script_telugu, +	unicode_script_kannada, +	unicode_script_malayalam, +	unicode_script_sinhala, +	unicode_script_thai, +	unicode_script_lao, +	unicode_script_tibetan, +	unicode_script_myanmar, +	unicode_script_georgian, +	unicode_script_hangul, +	unicode_script_ethiopic, +	unicode_script_cherokee, +	unicode_script_canadian_aboriginal, +	unicode_script_ogham, +	unicode_script_runic, +	unicode_script_khmer, +	unicode_script_mongolian, +	unicode_script_hiragana, +	unicode_script_katakana, +	unicode_script_bopomofo, +	unicode_script_han, +	unicode_script_yi, +	unicode_script_old_italic, +	unicode_script_gothic, +	unicode_script_deseret, +	unicode_script_inherited, +	unicode_script_tagalog, +	unicode_script_hanunoo, +	unicode_script_buhid, +	unicode_script_tagbanwa, +	unicode_script_limbu, +	unicode_script_tai_le, +	unicode_script_linear_b, +	unicode_script_ugaritic, +	unicode_script_shavian, +	unicode_script_osmanya, +	unicode_script_cypriot, +	unicode_script_braille, +	unicode_script_buginese, +	unicode_script_coptic, +	unicode_script_new_tai_lue, +	unicode_script_glagolitic, +	unicode_script_tifinagh, +	unicode_script_syloti_nagri, +	unicode_script_old_persian, +	unicode_script_kharoshthi, +	unicode_script_balinese, +	unicode_script_cuneiform, +	unicode_script_phoenician, +	unicode_script_phags_pa, +	unicode_script_nko, +	unicode_script_sundanese, +	unicode_script_lepcha, +	unicode_script_ol_chiki, +	unicode_script_vai, +	unicode_script_saurashtra, +	unicode_script_kayah_li, +	unicode_script_rejang, +	unicode_script_lycian, +	unicode_script_carian, +	unicode_script_lydian, +	unicode_script_cham, +	unicode_script_tai_tham, +	unicode_script_tai_viet, +	unicode_script_avestan, +	unicode_script_egyptian_hieroglyphs, +	unicode_script_samaritan, +	unicode_script_lisu, +	unicode_script_bamum, +	unicode_script_javanese, +	unicode_script_meetei_mayek, +	unicode_script_imperial_aramaic, +	unicode_script_old_south_arabian, +	unicode_script_inscriptional_parthian, +	unicode_script_inscriptional_pahlavi, +	unicode_script_old_turkic, +	unicode_script_kaithi, +	unicode_script_batak, +	unicode_script_brahmi, +	unicode_script_mandaic, +	unicode_script_chakma, +	unicode_script_meroitic_cursive, +	unicode_script_meroitic_hieroglyphs, +	unicode_script_miao, +	unicode_script_sharada, +	unicode_script_sora_sompeng, +	unicode_script_takri, +	unicode_script_caucasian_albanian, +	unicode_script_bassa_vah, +	unicode_script_duployan, +	unicode_script_elbasan, +	unicode_script_grantha, +	unicode_script_pahawh_hmong, +	unicode_script_khojki, +	unicode_script_linear_a, +	unicode_script_mahajani, +	unicode_script_manichaean, +	unicode_script_mende_kikakui, +	unicode_script_modi, +	unicode_script_mro, +	unicode_script_old_north_arabian, +	unicode_script_nabataean, +	unicode_script_palmyrene, +	unicode_script_pau_cin_hau, +	unicode_script_old_permic, +	unicode_script_psalter_pahlavi, +	unicode_script_siddham, +	unicode_script_khudawadi, +	unicode_script_tirhuta, +	unicode_script_warang_citi + +	/* UNICODE_SCRIPT_T */ +} unicode_script_t; +  /*  ** Look up the unicode script property, as per  ** http://www.unicode.org/reports/tr24/tr24-22.html  */ -const char *unicode_script(unicode_char a); +unicode_script_t unicode_script(unicode_char a);  /*  ** Implementation of line break rules, as per | 
