2012年8月13日 星期一

[轉貼][教學]字串處理及常規表示式(regular expression)

因為寫一個查詢需要用到,上網搜尋了之後發現很多人轉貼這篇文章,備份在網誌裡以便日後參考,文章版權屬於原作者。

Php教學文件
2005-08-04 Thursday by ben
參、字串處理及常規表示式(regular expression)

一、字串處理

trim();:去頭尾空白。
ltrim();:去頭部空白。
chop();:去尾部空白。
nl2br();將”\n”換行改成<br>。
print();同作用同echo,但print是函式,傳回布林值。
printf();格式化字串,傳回整數。
sprintf();格式化字串。
轉換規格%[顯示寬度][-][][.小數位數]型別:有-代表向左靠齊,沒-代表向右。
%b:將變數解釋為整數,並以二進位顯示。
%c:將變數解釋為整數,並以字元顯示。
%d:將變數解釋為整數,並以十進位顯示。
%f:將變數解釋為浮點數,並以浮點數顯示。
%o:將變數解釋為整數,並以八進位顯示。
%s:將變數解釋為字串,並以字串顯示。
%x:將變數解釋為整數,並以十六進位顯示,用a-f。
%X:將變數解釋為整數,並以十六進位顯示,用A-F。
AddSlashes();若有反斜時,加上Slash,讓輸入字串若含特殊字元時,加上逸出字元\,以免存入資料庫時衝碼。Q3上引數為變數時,做完此運算立刻存回此變數,導致變數值改變;較新的版本,引數為變數時,做完此運算不會導致變數值改變。
StripSlashes();若有反斜時,去掉Slash,使資料庫取出資料還原。Q3上引數為變數時,做完此運算立刻存回此變數,導致變數值改變;較新的版本,引數為變數時,做完此運算不會導致變數值改變。
strtoupper();轉大寫。
strtolower();轉小寫。
ucfirst();字串首轉大寫。
ucwords();字串中每個Word的字首轉大寫。
strtok(字串,”分隔字元”);:擷取字串的前面到分字元為止。
substr(字串,開始字元,長度);:擷取子字串,第一字元算0;開始字元為負,為字串尾減該數,即字尾算1倒數該數之字元。長度省略則取到字尾;長度為負則取到字尾倒數該數之字元。
strcmp(字串一,字串二);:比較兩字串,相等為0,正為字串一ASC碼大,負數為字串二ASC碼大。
strcasecmp(字串一,字串二);:同上,但不分大小寫。
strlen();:字串長度。
strstr(字串,欲找之子字串);:找到傳回子字串「第一次」出現以後之剩餘字串,找不到傳回「假」。
strchr(字串,欲找之子字串);:同上。
stristr(字串,欲找之子字串);:同上,但不分大小寫。
strrchr(字串,欲找之子字串);:找到傳回子字串「最後一次」出現以後之剩餘字串,找不到傳回「假」。
strpos(字串,欲找之子字串,指定蒐尋之起始位置);:找到傳回子字串「第一次」出現的位置,找不到傳回「假」。字串首位置算0,省略蒐尋起點時, 從字串首開始找。但是「假」傳回值是0,字首位置傳回值也是0,會混淆。可以用if(傳回值===fasle)測,如果成立傳回值代表「假」,如果不成立 傳回值代表位置0。
strrpos(字串,欲找之子字串,指定蒐尋之起始位置);:找到傳回「子字串字首字元」「最後一次」出現的位置,找不到傳回「假」。字串首位置算0,省略蒐尋起點時,從字串首開始找。
str_replace(蒐尋字串,代換字串,字串堆);:在字串堆中找到「蒐尋字串」並用「代換字串」換掉它們。
substr_replace(字串堆,代換字串,起點,長度);:在字串堆指定的起點及長度,用代換字串換掉它們。起點為0或正,由字串堆頭起算;起點 為負,由字串堆尾起算。長度未指定,則換到字串堆尾;長度為0,則插入原字串;長度為正,則取代幾個字串數;長度為負,則自尾端開如取代,停於長度。
二、正規表示式(regular expression)

PHP支援兩種正規表示式,POSIX和Perl。POSIX內建,Perl語法須將PCRE(Perl-compatible regular expression)程式庫編譯進來。正規表示式比字串慢,儘量用字串。

():括住子表示式。
[]:括住字元。
{}:括住重覆次數說明。
.除\
以外的單一字元。如.at相符於cat,sat,mat。
[a-z]、[^a-z]:a到z、非a-z。
[aeiou]
[a-zA-Z]
字元類別:
[[:alpha:]]:字母。
[[:alnum:]]:字母及數字。
[[:lower:]]:小寫字母。
[[:upper:]]:大寫字母。
[[:digit:]]:數字字元。
[[:xdigit:]]:16進位數字字元。
[[:punct:]]:標點。
[[:blank:]]:跳格及空白。
[[:space:]]:空白。
[[:cntrl:]]:控制字元。
[[:print:]]:所有可視字元。
[[:graph:]]:除空白字元外所有可視字元。
[]*:表示該樣式會出現0或0次以上。
[]+:表示該樣式會出現1或1次以上。如[[:alpha:]]+表示至少會有一個英文字母。
(very )*large:相符於large、very large、very very large。
{3}:重複三次。
{2,4}:重複二到四次。
{2,}:重複兩次以上。
^(在表示式外),表示式須出現在被蒐尋字串首才算相符。如^bob。
$,表示式須出現在被蒐尋字串尾才算相符。如com$。
^[a-z]$,字串頭尾之間,出現a-z任一字元就算相符。
(選項一)|(選項二)|(選項三):多選一都符合
特殊字元,在正規表示式中須以\特殊字元取代。
中括號外

\:跳脫字元。
^:比對字串頭。
$:比對字串尾。
.:換行之外的任意字元。
|:多重選擇起點(讀成OR)。
(:子樣式起點。
):子樣式終點。
*:重複0次以上。
+:重複1次以上。
{:重複次數 最小/最大 量化值起點。
}:重複次數 最小/最大 量化值終點。
中括號外

\:跳脫字元。
^:否定。
-:表示字元範圍。
ereg(正規表示式,被蒐尋字串,陣列名);:在被蒐尋字串中找符合於正規表示式的子字串,找到就放進陣列,成為一個元素。傳回真假(1,0)。陣列名可省略。
eregi(正規表示式,被蒐尋字串,陣列名);:同ereg,但不分大小寫。
ereg_replace(正規表示式,取代字串,被蒐尋字串);:在被蒐尋字串中找到表示式,用取代字串換掉。
eregi_replace(正規表示式,取代字串,被蒐尋字串);:同ereg_replace,但不分大小寫。
split(正規表示式表述之分隔字串,被切割字串,傳回元素上限);:用分隔字串,將被切割字串,切成一段段,成為陣列中一個個元素。傳回陣列。
參、字串處理及常規表示式(regular expression)

一、字串處理

trim();:去頭尾空白。
ltrim();:去頭部空白。
chop();:去尾部空白。
nl2br();將”\n”換行改成<br>。
print();同作用同echo,但print是函式,傳回布林值。
printf();格式化字串,傳回整數。
sprintf();格式化字串。
轉換規格%[顯示寬度][-][][.小數位數]型別:有-代表向左靠齊,沒-代表向右。
%b:將變數解釋為整數,並以二進位顯示。
%c:將變數解釋為整數,並以字元顯示。
%d:將變數解釋為整數,並以十進位顯示。
%f:將變數解釋為浮點數,並以浮點數顯示。
%o:將變數解釋為整數,並以八進位顯示。
%s:將變數解釋為字串,並以字串顯示。
%x:將變數解釋為整數,並以十六進位顯示,用a-f。
%X:將變數解釋為整數,並以十六進位顯示,用A-F。
AddSlashes();若有反斜時,加上Slash,讓輸入字串若含特殊字元時,加上逸出字元\,以免存入資料庫時衝碼。Q3上引數為變數時,做完此運算立刻存回此變數,導致變數值改變;較新的版本,引數為變數時,做完此運算不會導致變數值改變。
StripSlashes();若有反斜時,去掉Slash,使資料庫取出資料還原。Q3上引數為變數時,做完此運算立刻存回此變數,導致變數值改變;較新的版本,引數為變數時,做完此運算不會導致變數值改變。
strtoupper();轉大寫。
strtolower();轉小寫。
ucfirst();字串首轉大寫。
ucwords();字串中每個Word的字首轉大寫。
strtok(字串,”分隔字元”);:擷取字串的前面到分字元為止。
substr(字串,開始字元,長度);:擷取子字串,第一字元算0;開始字元為負,為字串尾減該數,即字尾算1倒數該數之字元。長度省略則取到字尾;長度為負則取到字尾倒數該數之字元。
strcmp(字串一,字串二);:比較兩字串,相等為0,正為字串一ASC碼大,負數為字串二ASC碼大。
strcasecmp(字串一,字串二);:同上,但不分大小寫。
strlen();:字串長度。
strstr(字串,欲找之子字串);:找到傳回子字串「第一次」出現以後之剩餘字串,找不到傳回「假」。
strchr(字串,欲找之子字串);:同上。
stristr(字串,欲找之子字串);:同上,但不分大小寫。
strrchr(字串,欲找之子字串);:找到傳回子字串「最後一次」出現以後之剩餘字串,找不到傳回「假」。
strpos(字串,欲找之子字串,指定蒐尋之起始位置);:找到傳回子字串「第一次」出現的位置,找不到傳回「假」。字串首位置算0,省略蒐尋起點時, 從字串首開始找。但是「假」傳回值是0,字首位置傳回值也是0,會混淆。可以用if(傳回值===fasle)測,如果成立傳回值代表「假」,如果不成立 傳回值代表位置0。
strrpos(字串,欲找之子字串,指定蒐尋之起始位置);:找到傳回「子字串字首字元」「最後一次」出現的位置,找不到傳回「假」。字串首位置算0,省略蒐尋起點時,從字串首開始找。
str_replace(蒐尋字串,代換字串,字串堆);:在字串堆中找到「蒐尋字串」並用「代換字串」換掉它們。
substr_replace(字串堆,代換字串,起點,長度);:在字串堆指定的起點及長度,用代換字串換掉它們。起點為0或正,由字串堆頭起算;起點 為負,由字串堆尾起算。長度未指定,則換到字串堆尾;長度為0,則插入原字串;長度為正,則取代幾個字串數;長度為負,則自尾端開如取代,停於長度。
二、正規表示式(regular expression)

PHP支援兩種正規表示式,POSIX和Perl。POSIX內建,Perl語法須將PCRE(Perl-compatible regular expression)程式庫編譯進來。正規表示式比字串慢,儘量用字串。

():括住子表示式。
[]:括住字元。
{}:括住重覆次數說明。
.除\
以外的單一字元。如.at相符於cat,sat,mat。
[a-z]、[^a-z]:a到z、非a-z。
[aeiou]
[a-zA-Z]
字元類別:
[[:alpha:]]:字母。
[[:alnum:]]:字母及數字。
[[:lower:]]:小寫字母。
[[:upper:]]:大寫字母。
[[:digit:]]:數字字元。
[[:xdigit:]]:16進位數字字元。
[[:punct:]]:標點。
[[:blank:]]:跳格及空白。
[[:space:]]:空白。
[[:cntrl:]]:控制字元。
[[:print:]]:所有可視字元。
[[:graph:]]:除空白字元外所有可視字元。
[]*:表示該樣式會出現0或0次以上。
[]+:表示該樣式會出現1或1次以上。如[[:alpha:]]+表示至少會有一個英文字母。
(very )*large:相符於large、very large、very very large。
{3}:重複三次。
{2,4}:重複二到四次。
{2,}:重複兩次以上。
^(在表示式外),表示式須出現在被蒐尋字串首才算相符。如^bob。
$,表示式須出現在被蒐尋字串尾才算相符。如com$。
^[a-z]$,字串頭尾之間,出現a-z任一字元就算相符。
(選項一)|(選項二)|(選項三):多選一都符合
特殊字元,在正規表示式中須以\特殊字元取代。
中括號外

\:跳脫字元。
^:比對字串頭。
$:比對字串尾。
.:換行之外的任意字元。
|:多重選擇起點(讀成OR)。
(:子樣式起點。
):子樣式終點。
*:重複0次以上。
+:重複1次以上。
{:重複次數 最小/最大 量化值起點。
}:重複次數 最小/最大 量化值終點。
中括號外

\:跳脫字元。
^:否定。
-:表示字元範圍。
ereg(正規表示式,被蒐尋字串,陣列名);:在被蒐尋字串中找符合於正規表示式的子字串,找到就放進陣列,成為一個元素。傳回真假(1,0)。陣列名可省略。
eregi(正規表示式,被蒐尋字串,陣列名);:同ereg,但不分大小寫。
ereg_replace(正規表示式,取代字串,被蒐尋字串);:在被蒐尋字串中找到表示式,用取代字串換掉。
eregi_replace(正規表示式,取代字串,被蒐尋字串);:同ereg_replace,但不分大小寫。
split(正規表示式表述之分隔字串,被切割字串,傳回元素上限);:用分隔字串,將被切割字串,切成一段段,成為陣列中一個個元素。傳回陣列。

文章來源1:http://www.j2h.tw/bbs/bbs16/269.html#
文章來源2:http://bee.no-ip.org/blog/liang/post/81
文章來源3:http://www.kume.idv.tw/read-241.html

沒有留言:

張貼留言