Selfish CORPus & Word Counter


Search Word
(空白指定で、全単語の出現頻度を表示します)
CORPUS Selection
(検索対象Directoryを指定してください)
Sort Option Ascending Order   Descending Order

SCORP検索によく使用される正規表現(Regular Expression)一覧
注:下で使われている\記号はバックスラッシュ(スラッシュ/の傾きが逆のもの)で,一般的なWindows日本語キーボードでは"ろ"キーを押すと入力できます. 但し日本語システムでは"¥"としてしか見えません.
 
Description
Example
.
改行コード以外の任意の1文字
 
[......]
...中の1文字
[abc] -> a,b,or c; cf.[A-Z]英大文字,[a-z]英小文字;
[^....]
...中にない1文字
[^abc] -> excluding a,b,and cf.[^a-z]英小文字以外
^
行頭(改行までが1行)
^Mr. President ->(行頭の)Mr. President
$
行末(改行までが1行)
it.$ -> ...(行末の)it.
\A
文字列先頭
 
\Z
文字列末尾
 
\b
単語境界
 
\B
単語境界以外
 
\w
英数字と_
\wは[0-9A-Za-z_]と同義 \w+ですべての英単語に相当させることが多い
\W
英数字と_以外
\Wは[^0-9A-Za-z_]に置き換えてもよい
\s
空白文字
\sin\s -> in; cf. excluding think,inside,pain,etc.
\S
空白文字以外
\Sin\S -> think,inside,pain,etc. cf. excluding in
\d
0,1,2,3...9
[0-9]と同義
\D
0,1,2,3,..9以外
[^0-9]と同義
\x
エスケープ シークエンス
\0:ヌル文字; \n:改行; \t:タブ文字;
*
0回以上の繰り返し
groo[o]*vy -> groovy or grooooovy
*?
同上(最短一致)
 
+
1回以上の繰り返し
sco[o]+by -> scooby or scooooby excluding scoby
+?
同上(最短一致)
 
?
0回または1回の繰り返し
you[r]? -> you or your
??
同上(最短一致)
 
{n,m}
n回以上m回以下の繰り返し
(heh){1,3} -> heh,hehhehheh
{n,m}?
同上(最短一致)
 
(...)
グループ
(abc) -> abc excluding a,ab,and acb
|
選択
(be|am|are|is|was|were|been) -> be動詞のいずれか

SCORP powered by Perl and Apahce