正規表現 のバックアップ(No.4) - PukiWiki

FrontPage

正規表現で日本語と半角英数字の間にスペースを挿入する
[edit]

テキスト中に全角文字と半角文字が混在していると、その間が詰まって見にくいことがある。そこで、ホームページなどでも、全角文字と半角文字の間に半角スペースを挿入することがよく行われる。いちいち手作業で半角スペースを挿入するのも面倒なので、今回は、PHP で自動的に半角スペースを挿入するプログラムを考えてみることにする。 考え方

今回は、全角平仮名と漢字、半角英数字のみを対象に考えてみることにする。 半角スペースを挿入する必要がある位置を■で示すと、

  1. 半角英数字が1つ以上並んでいる■日本語文字が1つ以上並んでいる
  2. 日本語文字が1つ以上並んでいる■半角英数字が1つ以上並んでいる

の2つのケースに限られる。 各々を正規表現であらわすと

  1. ([0-9A-Za-z]+)([ぁ-煕]+)
  2. ([ぁ-煕]+)([0-9A-Za-z]+)

となる。

このページのトップへ

改行を削除
[edit]

\r\n は改行を示す
このページのトップへ

全角カタカナ
[edit]

UTF-8

^[ァ-タダ-ヶ]*$

このページのトップへ

エスケープが必要な文字
[edit]

\ * + ? . { } ( ) [ ] ^ $ - | /
このページのトップへ

GUID形式の文字列にマッチする.Net正規表現
[edit]

(?i:{?(?<guid>([0-9A-Z]{8}(-?)[0-9A-Z]{4}\2[0-9A-Z]{4}\2[0-9A-Z]{4}\2[0-9A-Z]{12}))}?)

下記のような形式のGUIDをマッチできます。

{020cac21-6dcb-4d0e-ae79-86982cf3ad90}
{020cac216dcb4d0eae7986982cf3ad90}
020cac21-6dcb-4d0e-ae79-86982cf3ad90
020cac216dcb4d0eae7986982cf3ad90

コメント:




トップ   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS

e[NȂECir Yahoo yV LINEf[^[Ōz500~`I
z[y[W ̃NWbgJ[h COiq@COsیI COze