Syllable and word, breaker/boundary-segmentation for Myanmar text in JavaScript.
var syllable = require("./syllable-breaker");
var word = require("./word-breaker");
console.log( syllable('အင်္ဂါနေ့၏ဂြိုဟ်ကောင်သည်ခြင်္သေ့ဖြစ်သည်') );
// => [ 'အင်္ဂါ', 'နေ့', '၏', 'ဂြိုဟ်', 'ကောင်', 'သည်', 'ခြင်္သေ့', 'ဖြစ်', 'သည်' ]
console.log( word('ဘယ်အရာမဆိုအရာရာတိုင်းအဆိုးအကောင်းယှဉ်တွဲနေတယ်') );
// => [ 'ဘယ်အရာမဆို', 'အရာရာတိုင်း', 'အဆိုးအကောင်း', 'ယှဉ်တွဲ', 'နေ', 'တယ်' ]
- Syllable breaker is a JavaScript port of MyanmarParser-Py.
- Word breaker is based on following data
- dict-words.txt -> mydict-mmnlp-words.txt
- common-words.txt -> mydict-common-words.txt
- stop-words.txt -> stop_words.txt