summaryrefslogtreecommitdiffstats
path: root/unicode/unicode.h
diff options
context:
space:
mode:
Diffstat (limited to 'unicode/unicode.h')
-rw-r--r--unicode/unicode.h134
1 files changed, 133 insertions, 1 deletions
diff --git a/unicode/unicode.h b/unicode/unicode.h
index 715722a..a857fc3 100644
--- a/unicode/unicode.h
+++ b/unicode/unicode.h
@@ -92,12 +92,144 @@ extern uint8_t unicode_tab_lookup(unicode_char ch,
int unicode_grapheme_break(unicode_char a, unicode_char b);
+typedef enum {
+ /* UNICODE_SCRIPT_T */
+ unicode_script_unknown,
+ unicode_script_common,
+ unicode_script_latin,
+ unicode_script_greek,
+ unicode_script_cyrillic,
+ unicode_script_armenian,
+ unicode_script_hebrew,
+ unicode_script_arabic,
+ unicode_script_syriac,
+ unicode_script_thaana,
+ unicode_script_devanagari,
+ unicode_script_bengali,
+ unicode_script_gurmukhi,
+ unicode_script_gujarati,
+ unicode_script_oriya,
+ unicode_script_tamil,
+ unicode_script_telugu,
+ unicode_script_kannada,
+ unicode_script_malayalam,
+ unicode_script_sinhala,
+ unicode_script_thai,
+ unicode_script_lao,
+ unicode_script_tibetan,
+ unicode_script_myanmar,
+ unicode_script_georgian,
+ unicode_script_hangul,
+ unicode_script_ethiopic,
+ unicode_script_cherokee,
+ unicode_script_canadian_aboriginal,
+ unicode_script_ogham,
+ unicode_script_runic,
+ unicode_script_khmer,
+ unicode_script_mongolian,
+ unicode_script_hiragana,
+ unicode_script_katakana,
+ unicode_script_bopomofo,
+ unicode_script_han,
+ unicode_script_yi,
+ unicode_script_old_italic,
+ unicode_script_gothic,
+ unicode_script_deseret,
+ unicode_script_inherited,
+ unicode_script_tagalog,
+ unicode_script_hanunoo,
+ unicode_script_buhid,
+ unicode_script_tagbanwa,
+ unicode_script_limbu,
+ unicode_script_tai_le,
+ unicode_script_linear_b,
+ unicode_script_ugaritic,
+ unicode_script_shavian,
+ unicode_script_osmanya,
+ unicode_script_cypriot,
+ unicode_script_braille,
+ unicode_script_buginese,
+ unicode_script_coptic,
+ unicode_script_new_tai_lue,
+ unicode_script_glagolitic,
+ unicode_script_tifinagh,
+ unicode_script_syloti_nagri,
+ unicode_script_old_persian,
+ unicode_script_kharoshthi,
+ unicode_script_balinese,
+ unicode_script_cuneiform,
+ unicode_script_phoenician,
+ unicode_script_phags_pa,
+ unicode_script_nko,
+ unicode_script_sundanese,
+ unicode_script_lepcha,
+ unicode_script_ol_chiki,
+ unicode_script_vai,
+ unicode_script_saurashtra,
+ unicode_script_kayah_li,
+ unicode_script_rejang,
+ unicode_script_lycian,
+ unicode_script_carian,
+ unicode_script_lydian,
+ unicode_script_cham,
+ unicode_script_tai_tham,
+ unicode_script_tai_viet,
+ unicode_script_avestan,
+ unicode_script_egyptian_hieroglyphs,
+ unicode_script_samaritan,
+ unicode_script_lisu,
+ unicode_script_bamum,
+ unicode_script_javanese,
+ unicode_script_meetei_mayek,
+ unicode_script_imperial_aramaic,
+ unicode_script_old_south_arabian,
+ unicode_script_inscriptional_parthian,
+ unicode_script_inscriptional_pahlavi,
+ unicode_script_old_turkic,
+ unicode_script_kaithi,
+ unicode_script_batak,
+ unicode_script_brahmi,
+ unicode_script_mandaic,
+ unicode_script_chakma,
+ unicode_script_meroitic_cursive,
+ unicode_script_meroitic_hieroglyphs,
+ unicode_script_miao,
+ unicode_script_sharada,
+ unicode_script_sora_sompeng,
+ unicode_script_takri,
+ unicode_script_caucasian_albanian,
+ unicode_script_bassa_vah,
+ unicode_script_duployan,
+ unicode_script_elbasan,
+ unicode_script_grantha,
+ unicode_script_pahawh_hmong,
+ unicode_script_khojki,
+ unicode_script_linear_a,
+ unicode_script_mahajani,
+ unicode_script_manichaean,
+ unicode_script_mende_kikakui,
+ unicode_script_modi,
+ unicode_script_mro,
+ unicode_script_old_north_arabian,
+ unicode_script_nabataean,
+ unicode_script_palmyrene,
+ unicode_script_pau_cin_hau,
+ unicode_script_old_permic,
+ unicode_script_psalter_pahlavi,
+ unicode_script_siddham,
+ unicode_script_khudawadi,
+ unicode_script_tirhuta,
+ unicode_script_warang_citi
+
+ /* UNICODE_SCRIPT_T */
+} unicode_script_t;
+
/*
** Look up the unicode script property, as per
** http://www.unicode.org/reports/tr24/tr24-22.html
*/
-const char *unicode_script(unicode_char a);
+unicode_script_t unicode_script(unicode_char a);
/*
** Implementation of line break rules, as per