Releases: bab2min/kiwipiepy
Releases ยท bab2min/kiwipiepy
0.17.1
- Kiwi 0.17.1์ ๊ธฐ๋ฅ๋ค(https://github.com/bab2min/Kiwi/releases/tag/v0.17.1 )์ด ๋ฐ์๋์์ต๋๋ค.
- ์ฐ์ฒ ์คํ๋ฅผ ๊ต์ ํ๋ ๊ธฐ๋ฅ์ด ์ถ๊ฐ๋์์ต๋๋ค.
- ๋ฌธ์ฅ ๋ถ๋ฆฌ ์ ํ๋๊ฐ ํฅ์๋์์ต๋๋ค.
0.17.0
- Kiwi 0.17.0์ ๊ธฐ๋ฅ๋ค(https://github.com/bab2min/Kiwi/releases/tag/v0.17.0 )์ด ๋ฐ์๋์์ต๋๋ค.
- ๊ณต๋ฐฑ์ด ํฌํจ๋ ๋จ์ด๋ฅผ ์ฌ์ ์ ๋ฑ๋กํ ์ ์๋๋ก ๊ฐ์ ๋์์ต๋๋ค.
- ๊ธฐ๋ณธ ๋ค์ด์ ๋ช
์ฌ ์ฌ์ ์ด ์ถ๊ฐ๋์์ต๋๋ค.
Kiwi.__init__()
์load_multi_dict
์ธ์๋ฅผ ํตํด ๊ธฐ๋ณธ ๋ค์ด์ ๋ช ์ฌ ์ฌ์ ์ ๋ก๋ ์ ๋ฌด๋ฅผ ์ค์ ํ ์ ์์ต๋๋ค. - ๊ณต๋ฐฑ์ด ์๋ ๊ธด ๋ฌธ์์ด์ ๋ถ์ํ ๋ ํฌ๋์๊ฐ ๋ฐ์ํ๊ฑฐ๋ ์๋๊ฐ ๋๋ ค์ง๋ ๋ฒ๊ทธ๋ฅผ ์์ ํ์ต๋๋ค.
Kiwi.join()
์return_positions
์ธ์๊ฐ ์ถ๊ฐ๋์์ต๋๋ค. ์ด ์ธ์๋ฅผ ํตํด ๊ฐ ํํ์๋ค์ ๊ฒฐํฉ ํ ์์น๋ฅผ ๊ตฌํ ์ ์์ต๋๋ค.Kiwi.load_user_dictionary()
๋ฅผ ๋น๋กฏํ ์ผ๋ถ ๋ฉ์๋์์ ์๋ชป๋ ๊ฐ์ด ์ ๋ ฅ๋ ๊ฒฝ์ฐ ํฌ๋์๊ฐ ๋ฐ์ํ๋ ๋ฒ๊ทธ๊ฐ ์์ ๋์์ต๋๋ค.KiwiTokenizer
๊ฐtransformers>=4.29
์์ ํธํ๋์ง ์๋ ๋ฒ๊ทธ๋ฅผ ์์ ํ์ต๋๋ค.
0.16.2
0.16.1
- Kiwi 0.16.1์ ๊ธฐ๋ฅ๋ค(https://github.com/bab2min/Kiwi/releases/tag/v0.16.1 )์ด ๋ฐ์๋์์ต๋๋ค.
-๋ค.
ํํ๋ก ๋๋๋ ๋ฌธ์ฅ์ด๋ฏธ๊ฐ SB๋ก ๊ณผ๋ํ๊ฒ ์ค๋ถ์๋๋ ๋ฒ๊ทธ๊ฐ ์์ ๋์์ต๋๋ค.
- ํ๊ตญ์ด ํ
ํ๋ฆฟ์ ์ํ ํธ์ ๊ธฐ๋ฅ์ธ
Kiwi.template
์ด ์ถ๊ฐ๋์์ต๋๋ค.
0.16.0
๊ธฐ๋ฅ ์ถ๊ฐ/๊ฐ์
- Kiwi 0.16.0์ ๊ธฐ๋ฅ๋ค(https://github.com/bab2min/Kiwi/releases/tag/v0.16.0 )์ด ๋ฐ์๋์์ต๋๋ค.
- PretokenizedSpan๊ณผ ๊ด๋ จ๋ ๊ธฐ๋ฅ ์ถ๊ฐ
- ์์ ์๋ ๊ธ๋จธ๋ฆฌ ๊ธฐํธ๋ฅผ ๋ํ๋ด๋ SB ํ๊ทธ ์ถ๊ฐ.
๊ฐ.
,๋.
,๋ค.
๋ฑ์ ๊ธ๋จธ๋ฆฌ ๊ธฐํธ๊ฐ ๋ณ๋์ ๋ฌธ์ฅ์ผ๋ก ๋ถ๋ฆฌ๋์ง ์๋๋ก ๊ฐ์ - ์ฌ์ฉ์์ง์ ํ๊ทธ๋ก ์ฌ์ฉํ ์ ์๋ USER0 ~ USER4 ํ๊ทธ ์ถ๊ฐ
- ์ ๊ทํํ์ ๊ธฐ๋ฐ์ผ๋ก ํํ์๋ฅผ ์ฌ์ ์ ์ถ๊ฐํ๋
Kiwi.add_re_word
๋ฉ์๋ ์ถ๊ฐ Token.span
์ถ๊ฐToken.user_value
์ถ๊ฐ ๋ฐ user_value๋ฅผ ์ค์ ํ ์ ์๋๋กKiwi.add_user_word
๊ณ์ด์ ๋ฉ์๋์user_value
์ธ์ ์ถ๊ฐ- deprecated ๋์๋ ๋ฉ์๋๋ค ์ ๊ฑฐ
Kiwi.add_pre_analyzed_word
์์ ์์์์น/๋์์น๋ฅผ ์ง์ ํ์ง ์์์ง๋ง ๊ทธ ๊ฐ์ด ์๋ช ํ ๊ฒฝ์ฐ, ์๋์ผ๋ก ์ฑ์๋ฃ๋ ๊ธฐ๋ฅ ์ถ๊ฐKiwi.split_into_sents
์stopwords
์ธ์ ์ถ๊ฐ
๊ธฐ์ฌ์
Full Changelog: v0.15.2...v0.16.0
0.15.2
- Kiwi 0.15.2์ ๊ธฐ๋ฅ๋ค(https://github.com/bab2min/Kiwi/releases/tag/v0.15.2 )์ด ๋ฐ์๋์์ต๋๋ค.
- ๋งค์ฐ ๊ธด ํ ์คํธ๋ฅผ ๋ถ์ํ ๋ ์์ ์ง์ ์ด ์๋ชป ๋์ค๋ ๋ฒ๊ทธ ์์
- U+10000 ์ด์์ ๋ฌธ์๊ฐ ์ฌ๋ฌ ๊ฐ ํฌํจ๋ ํ ์คํธ๋ฅผ SwTokenizer๋ก encodeํ ๋ offset์ด ๋๋ฝ๋๋ ๋ฒ๊ทธ ์์
Kiwi.join
์์ ํํ์ ๊ฒฐํฉ ์ ๋์ด์ฐ๊ธฐ ์ ๋ฌด๋ฅผ ์ค์ ํ ์ ์๋ ๊ธฐ๋ฅ ์ถ๊ฐKiwi.tokenize
๋ก ํํ์ ๋ถ์ ํ ๋ค์Kiwi.join
์ ์ํํ๋ ๊ฒฝ์ฐ ์๋ณธ ํ ์คํธ์ ๋์ด์ฐ๊ธฐ๋ฅผ ์ต๋ํ ๋ฐ์ํ์ฌ ๊ฒฐํฉํ๋๋ก ๊ฐ์
0.15.1
- Kiwi 0.15.1์ ๊ธฐ๋ฅ๋ค(https://github.com/bab2min/Kiwi/releases/tag/v0.15.1 )์ด ๋ฐ์๋์์ต๋๋ค.
- Subword Tokenizer๋ฅผ ์ ๊ณตํ๋ ๋ชจ๋์ธ
kiwipiepiy.sw_tokenizer
์ด ์ถ๊ฐ๋์์ต๋๋ค. - huggingface์ tokenizer์ ํธํ๊ฐ๋ฅํ Subword Tokenizer๋ฅผ ์ ๊ณตํ๋ ๋ชจ๋์ธ
kiwipiepy.transformers_addon
์ด ์ถ๊ฐ๋์์ต๋๋ค.
0.15.0
- Kiwi 0.15.0์ ๊ธฐ๋ฅ๋ค(https://github.com/bab2min/Kiwi/releases/tag/v0.15.0 )์ด ๋ฐ์๋์์ต๋๋ค.
- ๋ ์ด์์ ํํ์๋ก ๋ ์๊ฒ ๋ถ๋ฆฌ๋ ์ ์๋ ํํ์๋ฅผ ์ถ๊ฐ ๋ถ๋ฆฌํ๋ ์ต์
์ธ
splitComplex
๋์ - ๋ถ์ฌํ์์ ์ฌ๋ฅผ ์ํ
XSM
ํ๊ทธ ์ถ๊ฐ ๋ฐ ์ด์ ํด๋นํ๋ ํํ์-์ด
,-ํ
,-๋ก
,-์ค๋
์ถ๊ฐ - ์กฐ์ฌ/์ด๋ฏธ์ ๋ง๋ถ๋ ๋ฐ์นจ์ ์ํ
Z_CODA
ํ๊ทธ ์ถ๊ฐ ๋ฐ ์กฐ์ฌ/์ด๋ฏธ์์ ์๋์ผ๋ก Z_CODA๋ฅผ ๋ถ์ ํด๋ด๋ ๊ธฐ๋ฅ ์ถ๊ฐ - ํํ ๋ถ์ ๋ฐ ์ธ์ด ๋ชจ๋ธ ํ์ ์๋ ์ต์ ํ
- ์ํ๊ธ ๋ฌธ์๋ฅผ ํน์ ๊ธฐํธ๋ก ๋ถ๋ฆฌํ์ง ์๊ณ ์ผ๋ฐ ํ๊ธ๊ณผ ๋์ผํ๊ฒ ์ฒ๋ฆฌํ๋๋ก ๊ฐ์
- ๋ฌธ์ฅ ๋ถ๋ฆฌ ์ฑ๋ฅ ๊ฐ์
2010. 01. 01.
์ ๊ฐ์ด ๊ณต๋ฐฑ์ด ํฌํจ๋ serial ํจํด ์ฒ๋ฆฌ ๋ณด๊ฐDr., Mr.
์ ๊ฐ์ด ์ฝ์ ํํ์.
์ด ๋ง์นจํ๋ก ์ฒ๋ฆฌ๋์ง ์๋๋ก ๋ณด๊ฐ- '-์'์ผ๋ก ๋ฌธ์ฅ์ด ๋๋๋ ๊ฒฝ์ฐ๋ฅผ ํ๋ณํ๊ธฐ ์ํด
์/EF
ํํ์ ์ถ๊ฐ ๋ฐ ๋ชจ๋ธ ๋ณด๊ฐ
- ํ ๋ฌธ์ฅ ๋ด์์ ์ฌ์ ์ ๋ฏธ๋ฑ์ฌ๋ ํํ๊ฐ 256๊ฐ ์ด์ ๋ฑ์ฅํ ๋ ํํ์ ๋ถ์ ๊ฒฐ๊ณผ๊ฐ ์๋ชป ๋์ค๋ ๋ฌธ์ ํด๊ฒฐ
- ํน์ ๊ฒฝ์ฐ์ ๋ฌธ์ฅ ๋ถ๋ฆฌ๊ฐ ์ ํ ๋์ง ์๋ ๋ฒ๊ทธ ์์ (#111)
- ์ด๋ชจ์ง ๋ฑ U+10000 ์ด์์ ์ ๋์ฝ๋ ๋ฌธ์๋ฅผ ๋ชจ๋ ํ์๋ก ๋ถ๋ฅํ๋ ๋ฒ๊ทธ ์์
- ๋ ์ด์์ ํํ์๋ก ๋ ์๊ฒ ๋ถ๋ฆฌ๋ ์ ์๋ ํํ์๋ฅผ ์ถ๊ฐ ๋ถ๋ฆฌํ๋ ์ต์
์ธ
Kiwi.glue
์insert_new_lines
์ธ์๊ฐ ์ถ๊ฐ๋์์ต๋๋ค.- ํํ์์ ์ฌ์ ํ์ ํ์ ๋ณด์ฌ์ฃผ๋
Token.lemma
ํ๋กํผํฐ๊ฐ ์ถ๊ฐ๋์์ต๋๋ค.
0.14.1
- Kiwi 0.14.1์ ๊ธฐ๋ฅ๋ค(https://github.com/bab2min/Kiwi/releases/tag/v0.14.1 )์ด ๋ฐ์๋์์ต๋๋ค.
- ํน์ ํ ์คํธ์ ๋ํด ํํ์ ๋ถํ ์์ด ์ ์ฒด ๊ฒฐ๊ณผ๋ฅผ ๊ทธ๋๋ก ๋ฐํํ๋ ์ค๋ฅ ํด๊ฒฐ
- EF ๋ค์ ๋ณด์กฐ์ฉ์ธ์ด ๋ฐ๋ผ์ค๋ ๊ฒฝ์ฐ ๋ฌธ์ฅ์ ๋ถ๋ฆฌํ์ง ์๋๋ก ๊ฐ์
- ์ด์ Python 3.11์ ์ง์ํฉ๋๋ค.
- ์ถ๊ฐ๋ก ์ด์ macOS์ฉ binary wheel์ arm64, x86_64๋ก ๋๋์ด์ ์ ๊ณตํฉ๋๋ค.
0.14.0
- Kiwi 0.14.0์ ๊ธฐ๋ฅ๋ค(https://github.com/bab2min/Kiwi/releases/tag/v0.14.0 )์ด ๋ฐ์๋์์ต๋๋ค.
- ๋์ฌ '์ด๋ฅด๋ค'์ ๋ชจํธ์ฑ ํด์ ๊ธฐ๋ฅ ์ถ๊ฐ
- W_SERIAL ํ๊ทธ ์ถ๊ฐ. SS ํ๊ทธ๋ฅผ SSO, SSC ํ๊ทธ๋ก ์ธ๋ถํ
- ์ธ์ฉ๋ฌธ ๋ฑ์ผ๋ก ๋๋ฌ์ธ์ธ ์๊ธด ๋ฌธ์ฅ์ด ํฌํจ๋ ๋ฌธ์ฅ์ ๋ํด ๋ฌธ์ฅ ๋ถ๋ฆฌ ์ฑ๋ฅ ๊ฐ์ (#84)
๋ฌ/๋/์
์ ๋ถ์ ์ ํ๋ ๊ฐ์- ๋ด์ฅ ์คํ ์ฌ์ ์ถ๊ฐ. ์ฌ์ฉ์ ์์น ์๋ ๊ฒฝ์ฐ
Kiwi(load_typo_dict=False)
๋ก ๋ ์ ์์ต๋๋ค.
- ๊ฐ์ข ๋ฒ๊ทธ๊ฐ ์์ ๋์์ต๋๋ค.