diff --git a/core/src/parser/adapter/orthographical_variant_adapter.rs b/core/src/parser/adapter/orthographical_variant_adapter.rs index 8294bb5b..7e28905e 100644 --- a/core/src/parser/adapter/orthographical_variant_adapter.rs +++ b/core/src/parser/adapter/orthographical_variant_adapter.rs @@ -30,6 +30,7 @@ pub trait OrthographicalVariants { const 籠: Variant; const 濱: Variant; const 祗: Variant; + const 曾: Variant; } impl OrthographicalVariants for Variant { @@ -60,6 +61,7 @@ impl OrthographicalVariants for Variant { const 籠: Variant = &["籠", "篭"]; const 濱: Variant = &["濱", "浜"]; const 祗: Variant = &["祗", "祇"]; + const 曾: Variant = &["曾", "曽"]; } pub struct OrthographicalVariantAdapter { diff --git a/core/src/tokenizer/read_town.rs b/core/src/tokenizer/read_town.rs index bf2d2935..0d0ea381 100644 --- a/core/src/tokenizer/read_town.rs +++ b/core/src/tokenizer/read_town.rs @@ -113,6 +113,7 @@ fn find_town(input: &str, candidates: &Vec) -> Option<(String, String)> Variant::籠, Variant::濱, Variant::祗, + Variant::曾, ], }; if let Some(result) = adapter.apply(input, candidate) { diff --git "a/tests/test_data/\347\225\260\345\255\227\344\275\223\346\227\247\345\255\227\344\275\223\343\201\270\343\201\256\345\257\276\345\277\234.csv" "b/tests/test_data/\347\225\260\345\255\227\344\275\223\346\227\247\345\255\227\344\275\223\343\201\270\343\201\256\345\257\276\345\277\234.csv" index 41339422..8afeb572 100644 --- "a/tests/test_data/\347\225\260\345\255\227\344\275\223\346\227\247\345\255\227\344\275\223\343\201\270\343\201\256\345\257\276\345\277\234.csv" +++ "b/tests/test_data/\347\225\260\345\255\227\344\275\223\346\227\247\345\255\227\344\275\223\343\201\270\343\201\256\345\257\276\345\277\234.csv" @@ -81,3 +81,6 @@ address,prefecture,city,town,rest # 「竃」と「竈」の表記ゆれへの対応 静岡県御殿場市竈1032,静岡県,御殿場市,竈,1032 静岡県御殿場市竃1032,静岡県,御殿場市,竈,1032 +# 「小曾根」と「小曽根」の表記ゆれへの対応 +埼玉県熊谷市小曽根1220,埼玉県,熊谷市,小曽根,1220 +埼玉県熊谷市小曾根1220,埼玉県,熊谷市,小曽根,1220