住所正規化コンバータタイトル

住所正規化のルール

全体のルール

  • 入力住所を「都道府県」「市区町村」「町域」「丁目・番・号」「ビル名」「号棟,階数,号室」といった構成要素に分割します。(*1)
  • 住所に対応した郵便番号を付与します。 (*2)
  • 住所に対応した市町村コードを付与します。(*3)
  • 住所に対応したカナ表記を付与します。
  • 住所に対応した緯度経度を付与します。(*4)
  • 郵便番号から住所を求める場合、事業所郵便番号に対応しています。(*4)

(*1) 「号棟,階数,号室」は正規化後、1 つの要素としてまとめられます。(例:2-202 など)
(*2) 小字までの住所で判別できる郵便番号に限ります。(番地・号まで含めて判別する郵便番号には対応していません。)
(*3) 基本は 5 桁の市区町村コードを返します。製品グレードに応じて、町・字別の住所コードを付与することができます。
(*4) ジオコーディング版の場合。

地名と丁番地のルール

  • 道府県名の省略を補完します。
  • 市区町村名における〜郡などの省略を補完します。
  • 市区町村名に含まれる「ヶ、ケ、が、ガ」「の、ノ」「ツ、っ、ッ」の文字については、住所マスタに登録された名称へと正規化します。
  • 異体字を識別し、住所マスタに登録された名称へと正規化します。
  • 番地に含まれる「東西南北右左」「番外」「英字番」といった表記も正規化します。
  • 番地の区切り文字はすべて半角のハイフン文字へと変換します。
  • 漢数字、ローマ数字はすべて半角の数字へと変換します。

建物情報のルール

  • 建物名と号棟,階数,号室を区分します。

京都の通り名表記の扱い

  • 京都の一部地域に見られる「通り名表記」については、通り名そのものを正規化の対象とします。例えば「河原通り」と入力された場合、これを 「河原町通」へ変換します。

合併

住所正規化コンバータが対応している合併パターンは次のとおりです。

合併パターン R4 R5
市区町村レベルでの市区町村名称の変更で、町域に影響を及ぼさないもの。 A郡B町(村)xxx → C市xxx
A市xxx → B市xxx
合併に伴う町域名称の変更で、接頭語として旧市区町村名称を伴うもの。 A郡B町(村)xxx → C市Bxxx
合併に伴い、一部の町域名称に(1)と(2)のパターンが混在する場合。 A市xxx → X市xxx
A市yyy → X市Ayyy
が混在
×
合併により完全に町域名称が変更されるもの A市xxx → B市yyy ×
区政化 A市xxx → A市B区xxx
A市xxx → A市B区とC区とにxxxが分離
×

住所正規化の例

一般的な変換例

番地に含まれる全角数字や、さまざまな区切り文字を正規化します。また県名や郡名の補完処理や、市区町村合併処理を行います。

入力住所 品川区西五反田七ノ二二ノ一七 ABCビル5階
正規化処理後 東京都 品川区 西五反田 7-22-17 ABCビル 5F
入力住所 北谷町美浜3の2 大三ビル二階
正規化処理後 沖縄県 中頭郡北谷町 美浜 3-2 大三ビル 2
入力住所 具志川市州崎五番地一 トロピカルテクノセンター内1F
正規化処理後 沖縄県 うるま市 州崎 5-1 トロピカルテクノセンター内 1F

「条」の扱い

「条」は漢数字に正規化します。

入力住所 石狩市花川南4条6丁目7グリーンハイツ4階
正規化処理後 北海道 石狩市 花川南四条 6-7 グリーンハイツ 4

「地割」の扱い

「地割」は半角数字に正規化します。

入力住所 岩手県西和賀町穴明22地割14-3 AAAビル 6F
正規化処理後 岩手県 和賀郡西和賀町 穴明 22地割14 AAAビル 6F

濁音などの表記揺れの扱い

地名に含まれる「ヶ、ケ、が、ガ」「の、ノ」「ツ、っ、ッ」は住所マスタに登録された名称へと正規化します。ただし建物名については変換の対象としませ ん。

入力住所 弘前市大字上瓦ヶ町25上瓦ヶ町ビル2F-203
正規化処理後 青森県 弘前市 上瓦ケ町 25 上瓦ヶ町ビル 2-203
入力住所 新宿区市ヶ谷本村町三ー二三 リビングビル9階
正規化処理後 東京都 新宿区 市谷本村町 3-23 リビングビル 9
入力住所 京都市左京区吉田牛宮町4 日本会館1階
正規化処理後 京都府 京都市左京区 吉田牛ノ宮町 4 日本会館 1

異体字

異体字は住所マスタに登録された名称へ正規化します。ただし建物名については変換の対象としません。

入力住所 那覇市壷川3丁目5番地7 壷川アパート 202
正規化処理後 沖縄県 那覇市 壺川 3-5-7 壷川アパート 202

京都の通り名

京都の通り名については、住所マスタに含まれる表記方法に合致するものを認識します。 また京都の通り名は町域名として扱います。

入力住所 京都市中京区木屋町通二条下東生洲町484
正規化処理後 京都府 京都市中京区 木屋町通二条下る東生洲町 484

丁番地と階数の連続表記

丁番地に階数が続いている場合、丁番地と階数を区別します。 「-」で連続表記される場合は、これを建物情報ではなく丁番地とみなします。 「棟」「号棟」「F」「階」「号室」という文字列が含まれていた場合、これを解釈します。

入力住所 浦添市安波茶3丁目5-2-2F 浦添店
正規化処理後 沖縄県 浦添市 安波茶 3-5-2 浦添店 2F
入力住所 浦添市安波茶3丁目5-2-2F-205号室 浦添店
正規化処理後 沖縄県 浦添市 安波茶 3-5-2 浦添店 2-205号室

※例に示した住所は架空のものです。