Рубин Регулярные выражения

Предыдущая: Рубин объектно-ориентированного

Далее: доступ к базе данных Руби - DBI Учебник

Регулярные выражения представляют собой особую последовательность символов, которая за счет использования специальных шаблонов синтаксиса , чтобы соответствовать или найти коллекцию строк.

Регулярные выражения используются ряд заранее определенных комбинаций определенных символов, и эти конкретные символы, образуют "правило строка", "правило строка" используется для выражения логической строки фильтрации.

грамматика

Регулярные выражения в буквальном смысле является слэш, или где - то посередине после режима% г с любым разделителем между ними, следующим образом :

/pattern/
/pattern/im    # 可以指定选项
%r!/usr/local! # 使用分隔符的正则表达式

примеров

#!/usr/bin/ruby

line1 = "Cats are smarter than dogs";
line2 = "Dogs also like meat";

if ( line1 =~ /Cats(.*)/ )
  puts "Line1 contains Cats"
end
if ( line2 =~ /Cats(.*)/ )
  puts "Line2 contains  Dogs"
end

Запуск в приведенном выше примере выход:

Line1 contains Cats

Регулярные выражения модификаторы

Регулярные выражения в буквальном смысле может содержать необязательный модификатор для управления различными аспектами матча. Модификатор после второго обозначения слэш, как показано в приведенном выше примере. Индекс перечислены возможные модификаторы:

Модификаторы	описание
Я	Игнорировать регистр при сопоставлении текста.
о	Выполняется только один раз # {} интерполяции, регулярное выражение в первый раз, когда он будет судим.
х	Игнорировать пробелы, допускаемого в пробелы и комментарии во всем выражении.
м	Сопоставление нескольких строк, символ новой строки распознается как обычный символ.
и, е, з, н	Регулярное выражение интерпретируется как Unicode (UTF-8), EUC, SJIS или ASCII. Если ключ не считается регулярное выражение с использованием исходного кода.

Как и строк, разделенных% Q Like, Ruby позволяет% г как начало регулярного выражения, с последующим произвольным разделителем. Это описание содержит большое количество очень полезно, когда вы не хотите, чтобы избежать слэш.

# 下面匹配单个斜杠字符，不转义
%r|/|               

# Flag 字符可通过下面的语法进行匹配
%r[</(.*)>]i

Шаблон регулярного выражения

Кроме управляющихсимволов, (+ * ^ $ () [] {} | ?. \), Все остальные символы соответствуют сами.Вы можете контролировать характер перед размещением обратной косой черты, чтобы избежать управляющих символов.

В следующей таблице перечислены синтаксиса регулярных выражений Руби.

模式	描述
^	匹配行的开头。
$	匹配行的结尾。
.	匹配除了换行符以外的任意单字符。使用 m 选项时，它也可以匹配换行符。
[...]	匹配在方括号中的任意单字符。
[^...]	匹配不在方括号中的任意单字符。
re*	匹配前面的子表达式零次或多次。
re+	匹配前面的子表达式一次或多次。
re?	匹配前面的子表达式零次或一次。
re{ n}	匹配前面的子表达式 n 次。
re{ n,}	匹配前面的子表达式 n 次或 n 次以上。
re{ n, m}	匹配前面的子表达式至少 n 次至多 m 次。
a\| b	匹配 a 或 b。
(re)	对正则表达式进行分组，并记住匹配文本。
(?imx)	暂时打开正则表达式内的 i、 m 或 x 选项。如果在圆括号中，则只影响圆括号内的部分。
(?-imx)	暂时关闭正则表达式内的 i、 m 或 x 选项。如果在圆括号中，则只影响圆括号内的部分。
(?: re)	对正则表达式进行分组，但不记住匹配文本。
(?imx: re)	暂时打开圆括号内的 i、 m 或 x 选项。
(?-imx: re)	暂时关闭圆括号内的 i、 m 或 x 选项。
(?#...)	注释。
(?= re)	使用模式指定位置。没有范围。
(?! re)	使用模式的否定指定位置。没有范围。
(?> re)	匹配无回溯的独立模式。
\w	匹配单词字符。
\W	匹配非单词字符。
\s	匹配空白字符。等价于 [\t\n\r\f]。
\S	匹配非空白字符。
\d	匹配数字。等价于 [0-9]。
\D	匹配非数字。
\A	匹配字符串的开头。
\Z	匹配字符串的结尾。如果存在换行符，则只匹配到换行符之前。
\z	匹配字符串的结尾。
\G	匹配最后一个匹配完成的点。
\b	当在括号外时匹配单词边界，当在括号内时匹配退格键（0x08）。
\B	匹配非单词边界。
\n, \t, etc.	匹配换行符、回车符、制表符，等等。
\1...\9	匹配第 n 个分组子表达式。
\10	如果已匹配过，则匹配第 n 个分组子表达式。否则指向字符编码的八进制表示。

Примеры регулярных выражений

характер

примеров	описание
/ Рубин /	Матч "Рубин"
¥	Йен символ соответствует. Ruby 1.9 и Ruby 1.8 поддерживает несколько символов.

Классы персонажей

实例	描述
/[Rr]uby/	匹配 "Ruby" 或 "ruby"
/rub[ye]/	匹配 "ruby" 或 "rube"
/[aeiou]/	匹配任何一个小写元音字母
/[0-9]/	匹配任何一个数字，与 /[0123456789]/ 相同
/[a-z]/	匹配任何一个小写 ASCII 字母
/[A-Z]/	匹配任何一个大写 ASCII 字母
/[a-zA-Z0-9]/	匹配任何一个括号内的字符
/[^aeiou]/	匹配任何一个非小写元音字母的字符
/[^0-9]/	匹配任何一个非数字字符

Специальные классы символов

实例	描述
/./	匹配除了换行符以外的其他任意字符
/./m	在多行模式下，也能匹配换行符
/\d/	匹配一个数字，等同于 /[0-9]/
/\D/	匹配一个非数字，等同于 /[^0-9]/
/\s/	匹配一个空白字符，等同于 /[ \t\r\n\f]/
/\S/	匹配一个非空白字符，等同于 /[^ \t\r\n\f]/
/\w/	匹配一个单词字符，等同于 /[A-Za-z0-9_]/
/\W/	匹配一个非单词字符，等同于 /[^A-Za-z0-9_]/

повторение

实例	描述
/ruby?/	匹配 "rub" 或 "ruby"。其中，y 是可有可无的。
/ruby*/	匹配 "rub" 加上 0 个或多个的 y。
/ruby+/	匹配 "rub" 加上 1 个或多个的 y。
/\d{3}/	刚好匹配 3 个数字。
/\d{3,}/	匹配 3 个或多个数字。
/\d{3,5}/	匹配 3 个、4 个或 5 个数字。

Нежадным повтор

Это будет соответствовать минимальное количество повторений.

实例	描述
/<.*>/	贪婪重复：匹配 "<ruby>perl>"
/<.*?>/	非贪婪重复：匹配 "<ruby>perl>" 中的 "<ruby>"

Сгруппированные скобками

实例	描述
/\D\d+/	无分组： + 重复 \d
/(\D\d)+/	分组： + 重复 \D\d 对
/([Rr]uby(, )?)+/	匹配 "Ruby"、"Ruby, ruby, ruby"，等等

Обратные ссылки

Этот матч перед матчем вновь группироваться.

实例	描述
/([Rr])uby&\1ails/	匹配 ruby&rails 或 Ruby&Rails
/(['"])(?:(?!\1).)*\1/	单引号或双引号字符串。\1 匹配第一个分组所匹配的字符，\2 匹配第二个分组所匹配的字符，依此类推。

замещать

实例	描述
/ruby\|rube/	匹配 "ruby" 或 "rube"
/rub(y\|le))/	匹配 "ruby" 或 "ruble"
/ruby(!+\|\?)/	"ruby" 后跟一个或多个 ! 或者跟一个 ?

анкер

Это требует согласования в указанное место.

实例	描述
/^Ruby/	匹配以 "Ruby" 开头的字符串或行
/Ruby$/	匹配以 "Ruby" 结尾的字符串或行
/\ARuby/	匹配以 "Ruby" 开头的字符串
/Ruby\Z/	匹配以 "Ruby" 结尾的字符串
/\bRuby\b/	匹配单词边界的 "Ruby"
/\brub\B/	\B 是非单词边界：匹配 "rube" 和 "ruby" 中的 "rub"，但不匹配单独的 "rub"
/Ruby(?=!)/	如果 "Ruby" 后跟着一个感叹号，则匹配 "Ruby"
/Ruby(?!!)/	如果 "Ruby" 后没有跟着一个感叹号，则匹配 "Ruby"

Скобки специальный синтаксис

实例	描述
/R(?#comment)/	匹配 "R"。所有剩余的字符都是注释。
/R(?i)uby/	当匹配 "uby" 时不区分大小写。
/R(?i:uby)/	与上面相同。
/rub(?:y\|le))/	只分组，不进行 \1 反向引用

Поиск и замена

кюгу и GSUBпеременные замещения и ихсуб!иGSUB!Очень важно при использовании стандартного метода выражения строки.

Все эти методы используют шаблон регулярного выражения для выполнения операций поиска и замены. кюгу и к югу!первый шаблон заменывстречаемости,GSUB иGSUB!заменить все вхождения шаблона.

кюгу и GSUBвозвращают новую строку , оставляя исходную строку не изменяется, и кюгу!иGSUB!изменять строки они будут звонить.

Вот пример:

#!/usr/bin/ruby
# -*- coding: UTF-8 -*-

phone = "138-3453-1111 #这是一个电话号码"

# 删除 Ruby 的注释
phone = phone.sub!(/#.*$/, "")   
puts "电话号码 : #{phone}"

# 移除数字以外的其他字符
phone = phone.gsub!(/\D/, "")    
puts "电话号码 : #{phone}"

Запуск в приведенном выше примере выход:

电话号码 : 138-3453-1111 
电话号码 : 13834531111

Вот еще один пример:

#!/usr/bin/ruby
# -*- coding: UTF-8 -*-

text = "rails 是 rails,  Ruby on Rails 非常好的 Ruby 框架"

# 把所有的 "rails" 改为 "Rails"
text.gsub!("rails", "Rails")

# 把所有的单词 "Rails" 都改成首字母大写
text.gsub!(/\brails\b/, "Rails")

puts "#{text}"

Запуск в приведенном выше примере выход:

Rails 是 Rails,  Ruby on Rails 非常好的 Ruby 框架

Предыдущая: Рубин объектно-ориентированного

Далее: доступ к базе данных Руби - DBI Учебник

Ruby курс

Ruby Расширенный учебник

Рубин Регулярные выражения

грамматика

примеров

Регулярные выражения модификаторы

Шаблон регулярного выражения

Примеры регулярных выражений

характер

Классы персонажей

Специальные классы символов

повторение

Нежадным повтор

Сгруппированные скобками

Обратные ссылки

замещать

анкер

Скобки специальный синтаксис

Поиск и замена