{"time":1743071912599,"blocks":[{"id":"PVTjwbcm9S","type":"header2","data":{"text":"Что такое регулярные выражения?","level":2},"tunes":{}},{"id":"_SzPMIYQV7","type":"paragraph","data":{"text":"Давайте разберёмся, что же собой представляют регулярные выражения. Если вам когда-нибудь приходилось работать с командной строкой, вы, вероятно, использовали маски имён файлов. Например, чтобы удалить все файлы в текущей директории, которые начинаются с буквы “d”, можно написать rm d*."}},{"id":"H8jahzi-PN","type":"paragraph","data":{"text":"Регулярные выражения представляют собой похожий, но гораздо более сильный инструмент для поиска строк, проверки их на соответствие какому-либо шаблону и другой подобной работы. Англоязычное название этого инструмента — Regular Expressions или просто RegExp. Строго говоря, регулярные выражения — специальный язык для описания шаблонов строк."}},{"id":"BgaO2FtV5R","type":"paragraph","data":{"text":"Реализация этого инструмента различается в разных языках программирования, хоть и не сильно. В данной статье мы будем ориентироваться в первую очередь на реализацию Perl Compatible Regular Expressions."}},{"id":"G71Z3m5s7b","type":"header2","data":{"text":"Основы синтаксиса","level":2},"tunes":{}},{"id":"5LmSZtHV9S","type":"paragraph","data":{"text":"В первую очередь стоит заметить, что любая строка сама по себе является регулярным выражением. Так, выражению Хаха, очевидно, будет соответствовать строка “Хаха” и только она. Регулярки являются регистрозависимыми, поэтому строка “хаха” (с маленькой буквы) уже не будет соответствовать выражению выше."}},{"id":"3868b76a-fc50-4c6a-aaf6-7394b8159bbb","type":"banner-blank","data":{}},{"id":"tbXZpQ2UM2","type":"paragraph","data":{"text":"Однако уже здесь следует быть аккуратным — как и любой язык, регекспы имеют спецсимволы, которые нужно экранировать. Вот их список: . ^ $ * + ? { } [ ] \\ | ( ). Экранирование осуществляется обычным способом — добавлением \\ перед спецсимволом."}},{"id":"VPOSlGXewR","type":"header2","data":{"text":"Набор символов","level":2},"tunes":{}},{"id":"qTLr5sxQVk","type":"paragraph","data":{"text":"Предположим, мы хотим найти в тексте все междометия, обозначающие смех. Просто Хаха нам не подойдёт — ведь под него не попадут “Хехе”, “Хохо” и “Хихи”. Да и проблему с регистром первой буквы нужно как-то решить."}},{"id":"dUZmIvk5C4","type":"paragraph","data":{"text":"Здесь нам на помощь придут наборы — вместо указания конкретного символа, мы можем записать целый список, и если в исследуемой строке на указанном месте будет стоять любой из перечисленных символов, строка будет считаться подходящей. Наборы записываются в квадратных скобках — паттерну [abcd] будет соответствовать любой из символов “a”, “b”, “c” или “d”."}},{"id":"MK2vLXP6Xl","type":"paragraph","data":{"text":"Внутри набора большая часть спецсимволов не нуждается в экранировании, однако использование \\ перед ними не будет считаться ошибкой. По прежнему необходимо экранировать символы “\\” и “^”, и, желательно, “]” (так, [][] обозначает любой из символов “]” или «[», тогда как [[]х] — исключительно последовательность “[х]”). Необычное на первый взгляд поведение регулярок с символом “]” на самом деле определяется известными правилами, но гораздо легче просто экранировать этот символ, чем их запоминать. Кроме этого, экранировать нужно символ «-», он используется для задания диапазонов (см. ниже)."}},{"id":"ebab71f3-2131-400e-9b58-7f5d6f14c806","type":"banner-blank","data":{}},{"id":"UbBwyvB7zL","type":"paragraph","data":{"text":"Если сразу после [ записать символ ^, то набор приобретёт обратный смысл — подходящим будет считаться любой символ кроме указанных. Так, паттерну [^xyz] соответствует любой символ, кроме, собственно, “x”, “y” или “z”."}},{"id":"VNhFMVOJ62","type":"paragraph","data":{"text":"Итак, применяя данный инструмент к нашему случаю, если мы напишем [Хх][аоие]х[аоие], то каждая из строк “Хаха”, “хехе”, “хихи” и даже “Хохо” будут соответствовать шаблону."}},{"id":"TiiwXsJJSJ","type":"header3","data":{"text":"Предопределённые классы символов","level":3},"tunes":{}},{"id":"dg-KuZsKKE","type":"paragraph","data":{"text":"Для некоторых наборов, которые используются достаточно часто, существуют специальные шаблоны. Так, для описания любого пробельного символа (пробел, табуляция, перенос строки) используется \\s, для цифр — \\d, для символов латиницы, цифр и подчёркивания “_” — \\w."}},{"id":"0TvSHZcI1a","type":"paragraph","data":{"text":"Если необходимо описать вообще любой символ, для этого используется точка — .. Если указанные классы написать с заглавной буквы (\\S, \\D, \\W) то они поменяют свой смысл на противоположный — любой непробельный символ, любой символ, который не является цифрой, и любой символ кроме латиницы, цифр или подчёркивания соответственно."}},{"id":"6e3cb5c8-f748-46c7-972c-ed123d8c046a","type":"banner-blank","data":{}},{"id":"clA16DLTbv","type":"paragraph","data":{"text":"Также с помощью регулярных выражений есть возможность проверить положение строки относительно остального текста. Выражение \\b обозначает границу слова, \\B — не границу слова, ^ — начало текста, а $ — конец. Так, по паттерну \\bJava\\b в строке “Java and JavaScript” найдутся первые 4 символа, а по паттерну \\bJava\\B — символы c 10-го по 13-й (в составе слова “JavaScript”)."}},{"id":"RQDyhfpQZ_","type":"image","data":{"alt":"","title":"","caption":"","file":{"id":28064,"url":"https://media.tproger.ru/uploads/2017/01/iknowregularexpressions.jpg"},"stretched":false,"withBackground":false,"withBorder":false,"width":600,"height":607,"optimizedFile":{"original":"https://media.tproger.ru/uploads/2017/01/iknowregularexpressions.jpg","alt":"Регулярные выражения: начало работы с RegExp 1","dimensions":{"width":600,"height":607},"additionalSizes":{"srcSet":[{"url":"https://tproger.ru/signed_image/WONqTj9DBB4ugLdIXCGoLj9RdrnW6AhTNq_u4O69TFQ/rs:fill:600:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAxNy8wMS9pa25vd3JlZ3VsYXJleHByZXNzaW9ucy5qcGc","dpr":1,"width":600},{"url":"https://tproger.ru/signed_image/csKwz65Yk3PD2zEJak5AWs-5Yj0quuoebSsp4Xl7foA/rs:fill:1200:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAxNy8wMS9pa25vd3JlZ3VsYXJleHByZXNzaW9ucy5qcGc","dpr":1,"width":1200},{"url":"https://tproger.ru/signed_image/WONqTj9DBB4ugLdIXCGoLj9RdrnW6AhTNq_u4O69TFQ/rs:fill:600:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAxNy8wMS9pa25vd3JlZ3VsYXJleHByZXNzaW9ucy5qcGc","dpr":1,"width":600},{"url":"https://tproger.ru/signed_image/csKwz65Yk3PD2zEJak5AWs-5Yj0quuoebSsp4Xl7foA/rs:fill:1200:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAxNy8wMS9pa25vd3JlZ3VsYXJleHByZXNzaW9ucy5qcGc","dpr":1,"width":1200},{"url":"https://tproger.ru/signed_image/WONqTj9DBB4ugLdIXCGoLj9RdrnW6AhTNq_u4O69TFQ/rs:fill:600:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAxNy8wMS9pa25vd3JlZ3VsYXJleHByZXNzaW9ucy5qcGc","dpr":1,"width":600},{"url":"https://tproger.ru/signed_image/csKwz65Yk3PD2zEJak5AWs-5Yj0quuoebSsp4Xl7foA/rs:fill:1200:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAxNy8wMS9pa25vd3JlZ3VsYXJleHByZXNzaW9ucy5qcGc","dpr":1,"width":1200},{"url":"https://tproger.ru/signed_image/9SpIiSKckfYHuWprW3kDEGtWBvftm6G2VdvLAnUMIUQ/rs:fill:466:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAxNy8wMS9pa25vd3JlZ3VsYXJleHByZXNzaW9ucy5qcGc","dpr":1,"width":466},{"url":"https://tproger.ru/signed_image/q-QVqK1WxS2ecDZ31eewIShyM9ZBVgkWLQFOVkzPR7I/rs:fill:932:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAxNy8wMS9pa25vd3JlZ3VsYXJleHByZXNzaW9ucy5qcGc","dpr":1,"width":932}],"sizes":[{"media":"(min-width: 1441px)","size":"600px"},{"media":"(min-width: 1281px)","size":"600px"},{"media":"(min-width: 1281px)","size":"600px"},{"media":"(min-width: 961px)","size":"600px"},{"media":"(min-width: 671px)","size":"600px"},{"media":"(min-width: 500px)","size":"466px"}]}}}},{"id":"6ArZF-2c4D","type":"header3","data":{"text":"Диапазоны","level":3},"tunes":{}},{"id":"HfSnVh1PMY","type":"paragraph","data":{"text":"У вас может возникнуть необходимость обозначить набор, в который входят буквы, например, от “б” до “ф”. Вместо того, чтобы писать [бвгдежзиклмнопрстуф] можно воспользоваться механизмом диапазонов и написать [б-ф]. Так, паттерну x[0-8A-F][0-8A-F] соответствует строка “xA6”, но не соответствует “xb9” (во-первых, из-за того, что в диапазоне указаны только заглавные буквы, во-вторых, из-за того, что 9 не входит в промежуток 0-8)."}},{"id":"P_kycfMMJU","type":"paragraph","data":{"text":"Механизм диапазонов особенно актуален для русского языка, ведь для него нет конструкции, аналогичной \\w. Чтобы обозначить все буквы русского алфавита, можно использовать паттерн [а-яА-ЯёЁ]. Обратите внимание, что буква “ё” не включается в общий диапазон букв, и её нужно указывать отдельно."}},{"id":"gtLipjwVZT","type":"header2","data":{"text":"Квантификаторы","level":2},"tunes":{}},{"id":"qp02fQnEQ8","type":"paragraph","data":{"text":"Вернёмся к нашему примеру. Что, если в “смеющемся” междометии будет больше одной гласной между буквами “х”, например “Хаахаааа”? Наша старая регулярка уже не сможет нам помочь. Здесь нам придётся воспользоваться квантификаторами."}},{"id":"9mAMQbne2d","type":"image","data":{"alt":"","title":"","caption":"","file":{"id":132994,"url":"https://media.tproger.ru/uploads/2017/01/table1.png"},"stretched":false,"withBackground":false,"withBorder":false,"width":849,"height":202,"optimizedFile":{"original":"https://media.tproger.ru/uploads/2017/01/table1.png","alt":"Регулярные выражения: начало работы с RegExp 2","dimensions":{"width":849,"height":202},"additionalSizes":{"srcSet":[{"url":"https://tproger.ru/signed_image/6PnlOy2lrhZmmYQ5AiU9x-3gr5SxMpUIbzrkwkGXBLk/rs:fill:766:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAxNy8wMS90YWJsZTEucG5n","dpr":1,"width":766},{"url":"https://tproger.ru/signed_image/h7CGuavgx9Fc0SKlbG317HGNkrZJy_3C0lJxb9Zy0Ng/rs:fill:1532:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAxNy8wMS90YWJsZTEucG5n","dpr":1,"width":1532},{"url":"https://tproger.ru/signed_image/dTQaDudDSj7jCQAJvDtrEsZFaI8CRYDh4EfrqLhCGXY/rs:fill:686:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAxNy8wMS90YWJsZTEucG5n","dpr":1,"width":686},{"url":"https://tproger.ru/signed_image/UljUfayUuKCMQAjT74qlUTwbrcZqGn9Sn8ERgGQk5ls/rs:fill:1372:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAxNy8wMS90YWJsZTEucG5n","dpr":1,"width":1372},{"url":"https://tproger.ru/signed_image/tGC-Dm3ULr3Lj5e1E3rq1KC9nD1D6pU5leETUjpW2k4/rs:fill:636:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAxNy8wMS90YWJsZTEucG5n","dpr":1,"width":636},{"url":"https://tproger.ru/signed_image/5ch9vhpXH72bKglxzSU3-31sKF2X8CNZZiSrWWySd3k/rs:fill:1272:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAxNy8wMS90YWJsZTEucG5n","dpr":1,"width":1272},{"url":"https://tproger.ru/signed_image/acCjcs26cW3x6nK9N7ZTbkhlWqYjKpN3-oleJKl6VOM/rs:fill:466:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAxNy8wMS90YWJsZTEucG5n","dpr":1,"width":466},{"url":"https://tproger.ru/signed_image/h7q4rc-2NXRz5_qmwpNOCO9eeCrKlfPWfSNzx1sw2uc/rs:fill:932:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAxNy8wMS90YWJsZTEucG5n","dpr":1,"width":932}],"sizes":[{"media":"(min-width: 1441px)","size":"766px"},{"media":"(min-width: 1281px)","size":"686px"},{"media":"(min-width: 1281px)","size":"766px"},{"media":"(min-width: 961px)","size":"766px"},{"media":"(min-width: 671px)","size":"636px"},{"media":"(min-width: 500px)","size":"466px"}]}}}},{"id":"YCaLDbK_fF","type":"paragraph","data":{"text":"Обратите внимание, что квантификатор применяется только к символу, который стоит перед ним."}},{"id":"tiyUnCQ5DN","type":"paragraph","data":{"text":"Некоторые часто используемые конструкции получили в языке RegEx специальные обозначения:"}},{"id":"j70v6Cg8Ni","type":"image","data":{"alt":"","title":"","caption":"","file":{"id":132997,"url":"https://media.tproger.ru/uploads/2017/01/table2.png"},"stretched":false,"withBackground":false,"withBorder":false,"width":851,"height":166,"optimizedFile":{"original":"https://media.tproger.ru/uploads/2017/01/table2.png","alt":"Регулярные выражения: начало работы с RegExp 3","dimensions":{"width":851,"height":166},"additionalSizes":{"srcSet":[{"url":"https://tproger.ru/signed_image/j75pZusVY-sigv9Mqhmj_g4rkqOAWpl-wyyH6082cY4/rs:fill:766:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAxNy8wMS90YWJsZTIucG5n","dpr":1,"width":766},{"url":"https://tproger.ru/signed_image/x1wU0SaHpK0fPmmPD32J9xdoA99dSyXku5Jq-LtA9mE/rs:fill:1532:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAxNy8wMS90YWJsZTIucG5n","dpr":1,"width":1532},{"url":"https://tproger.ru/signed_image/Uxum-L0cVdTMCZleM2KesPdPe5ymLDVTDsEQwqY6bKk/rs:fill:686:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAxNy8wMS90YWJsZTIucG5n","dpr":1,"width":686},{"url":"https://tproger.ru/signed_image/SCFmrCqfF2LwlgJTTS-6q5bHR_e5nQWoz6qhRO3eBuc/rs:fill:1372:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAxNy8wMS90YWJsZTIucG5n","dpr":1,"width":1372},{"url":"https://tproger.ru/signed_image/FdM3HnBYUw_eCElg3YPkAt5TZhum-1WoPWKrZZtXE5g/rs:fill:636:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAxNy8wMS90YWJsZTIucG5n","dpr":1,"width":636},{"url":"https://tproger.ru/signed_image/sgG391LypLi2yfI7tmBwxzQ7CvzJaqnIMRTiE8PFEO4/rs:fill:1272:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAxNy8wMS90YWJsZTIucG5n","dpr":1,"width":1272},{"url":"https://tproger.ru/signed_image/zT84s4XCAxJzBJzUdGMuRUvXcJoT_QutRt6niiM7WmM/rs:fill:466:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAxNy8wMS90YWJsZTIucG5n","dpr":1,"width":466},{"url":"https://tproger.ru/signed_image/7YdBhiogR6nkHIheFh92NrOl6uA4Z_cuWounF56SUVQ/rs:fill:932:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAxNy8wMS90YWJsZTIucG5n","dpr":1,"width":932}],"sizes":[{"media":"(min-width: 1441px)","size":"766px"},{"media":"(min-width: 1281px)","size":"686px"},{"media":"(min-width: 1281px)","size":"766px"},{"media":"(min-width: 961px)","size":"766px"},{"media":"(min-width: 671px)","size":"636px"},{"media":"(min-width: 500px)","size":"466px"}]}}}},{"id":"iZtdY0_1oV","type":"paragraph","data":{"text":"Таким образом, с помощью квантификаторов мы можем улучшить наш шаблон для междометий до [Хх][аоеи]+х[аоеи]*, и он сможет распознавать строки “Хааха”, “хееееех” и “Хихии”."}},{"id":"3EHioY3HNv","type":"header3","data":{"text":"Ленивая квантификация","level":3},"tunes":{}},{"id":"OlRxUUk7ZG","type":"paragraph","data":{"text":"Предположим, перед нами стоит задача — найти все HTML-теги в строке"}},{"id":"wP8D9EgqNl","type":"code","data":{"code":"Tproger — мой любимый сайт о программировании!","language":"clike","lineNumbers":false,"startLineNumber":1,"stretched":false}},{"id":"cYJzLfocDp","type":"paragraph","data":{"text":"Очевидное решение <.*> здесь не сработает — оно найдёт всю строку целиком, т.к. она начинается с тега абзаца и им же заканчивается. То есть содержимым тега будет считаться строка"}},{"id":"Plk4Q0Qjle","type":"code","data":{"code":"p>Tproger — мой любимый сайт о программировании!","language":"html","lineNumbers":false,"startLineNumber":1,"stretched":false}},{"id":"bKvtUqwhtV","type":"paragraph","data":{"text":"Это происходит из-за того, что по умолчанию квантификатор работают по т.н. жадному алгоритму — старается вернуть как можно более длинную строку, соответствующую условию. Решить проблему можно двумя способами. Первый — использовать выражение <[^>]*>, которое запретит считать содержимым тега правую угловую скобку. Второй — объявить квантификатор не жадным, а ленивым. Делается это с помощью добавления справа к квантификатору символа ?. Т.е. для поиска всех тегов выражение обратится в <.*?>."}},{"id":"0Q3eqHSaf7","type":"header3","data":{"text":"Ревнивая квантификация","level":3},"tunes":{}},{"id":"ROW3ZkpF3R","type":"paragraph","data":{"text":"Иногда для увеличения скорости поиска (особенно в тех случаях, когда строка не соответствует регулярному выражению) можно использовать запрет алгоритму возвращаться к предыдущим шагам поиска для того, чтобы найти возможные соответствия для оставшейся части RegExp. Это называется ревнивой квантификацией. Квантификатор делается ревнивым с помощью добавления к нему справа символа +. Ещё одно применение ревнивой квантификации — исключение нежелательных совпадений. Так, паттерну ab*+a в строке “ababa” будут соответствовать только первые три символа, но не символы с третьего по пятый, т.к. символ “a”, который стоит на третьей позиции, уже был использован для первого результата."}},{"id":"oacaxgmsO5","type":"paragraph","data":{"text":"Чуть больше о жадном, сверхжадном и ленивом режимах квантификации вы сможете узнать из статьи о регулярных выражениях в Java."}},{"id":"4206oGgiDI","type":"header2","data":{"text":"Скобочные группы","level":2},"tunes":{}},{"id":"LNhY-Q5Enm","type":"paragraph","data":{"text":"Для нашего шаблона “смеющегося” междометия осталась самая малость — учесть, что буква “х” может встречаться более одного раза, например, “Хахахахааахахооо”, а может и вовсе заканчиваться на букве “х”. Вероятно, здесь нужно применить квантификатор для группы [аиое]+х, но если мы просто напишем [аиое]х+, то квантификатор + будет относиться только к символу “х”, а не ко всему выражению. Чтобы это исправить, выражение нужно взять в круглые скобки: ([аиое]х)+."}},{"id":"3600bc7d-8651-496b-a305-de275d6f1739","type":"banner-blank","data":{}},{"id":"vdEb6aDY2y","type":"paragraph","data":{"text":"Таким образом, наше выражение превращается в [Хх]([аиое]х?)+ — сначала идёт заглавная или строчная “х”, а потом произвольное ненулевое количество гласных, которые (возможно, но не обязательно) перемежаются одиночными строчными “х”. Однако это выражение решает проблему лишь частично — под это выражение попадут и такие строки, как, например, “хихахех” — кто-то может быть так и смеётся, но допущение весьма сомнительное. Очевидно, мы можем использовать набор из всех гласных лишь единожды, а потом должны как-то опираться на результат первого поиска. Но как?…"}},{"id":"_J7lkARUQ1","type":"header3","data":{"text":"Запоминание результата поиска по группе","level":3},"tunes":{}},{"id":"hPDEu6R5mD","type":"paragraph","data":{"text":"Оказывается, результат поиска по скобочной группе записывается в отдельную ячейку памяти, доступ к которой доступен для использования в последующих частях регэкспа. Возвращаясь к задаче с поиском HTML-тегов на странице, нам может понадобиться не только найти теги, но и узнать их название. В этом нам может помочь регулярное выражение <(.*?)>."}},{"id":"IxufSLnb12","type":"code","data":{"code":"Tproger — мой любимый сайт о программировании!","language":"html","lineNumbers":false,"startLineNumber":1,"stretched":false}},{"id":"vRcw0OCCD6","type":"paragraph","data":{"text":"Результат поиска по всему регексу: “”, “”, “”, “”, “”, “”.
Результат поиска по первой группе: “p”, “b”, “/b”, “i”, “/i”, “/i”, “/p”."}},{"id":"AzSxQLe1AD","type":"paragraph","data":{"text":"На результат поиска по группе можно ссылаться с помощью выражения \\n, где n — цифра от 1 до 9. Например выражению (\\w)(\\w)\\1\\2 соответствуют строки “aaaa”, “abab”, но не соответствует “aabb”."}},{"id":"Hkguy-WsXZ","type":"paragraph","data":{"text":"Если выражение берётся в скобки только для применения к ней квантификатора (не планируется запоминать результат поиска по этой группе), то сразу после первой скобки стоит добавить ?:, например (?:[abcd]+\\w)."}},{"id":"4ae4813e-af8c-438e-a21a-74093c787625","type":"banner-blank","data":{}},{"id":"W83HjQWmo7","type":"paragraph","data":{"text":"С использованием этого механизма мы можем переписать наше выражение к виду [Хх]([аоие])х?(?:\\1х?)*."}},{"id":"j7EQ22m7Sw","type":"image","data":{"alt":"","title":"","caption":"","file":{"id":28066,"url":"https://media.tproger.ru/uploads/2017/01/RegEx-lovehate.jpg"},"stretched":false,"withBackground":false,"withBorder":false,"width":480,"height":343,"optimizedFile":{"original":"https://media.tproger.ru/uploads/2017/01/RegEx-lovehate.jpg","alt":"Регулярные выражения: начало работы с RegExp 4","dimensions":{"width":480,"height":343},"additionalSizes":{"srcSet":[{"url":"https://tproger.ru/signed_image/Q51zZ_0FtHJWF65Hl9UOflGprOnDQkqSKEt49AKINzo/rs:fill:480:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAxNy8wMS9SZWdFeC1sb3ZlaGF0ZS5qcGc","dpr":1,"width":480},{"url":"https://tproger.ru/signed_image/4aM4ws-VI_yGQfTihT8wt8JEJaQ9Pc17cWb6x6SZPtw/rs:fill:960:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAxNy8wMS9SZWdFeC1sb3ZlaGF0ZS5qcGc","dpr":1,"width":960},{"url":"https://tproger.ru/signed_image/Q51zZ_0FtHJWF65Hl9UOflGprOnDQkqSKEt49AKINzo/rs:fill:480:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAxNy8wMS9SZWdFeC1sb3ZlaGF0ZS5qcGc","dpr":1,"width":480},{"url":"https://tproger.ru/signed_image/4aM4ws-VI_yGQfTihT8wt8JEJaQ9Pc17cWb6x6SZPtw/rs:fill:960:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAxNy8wMS9SZWdFeC1sb3ZlaGF0ZS5qcGc","dpr":1,"width":960},{"url":"https://tproger.ru/signed_image/Q51zZ_0FtHJWF65Hl9UOflGprOnDQkqSKEt49AKINzo/rs:fill:480:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAxNy8wMS9SZWdFeC1sb3ZlaGF0ZS5qcGc","dpr":1,"width":480},{"url":"https://tproger.ru/signed_image/4aM4ws-VI_yGQfTihT8wt8JEJaQ9Pc17cWb6x6SZPtw/rs:fill:960:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAxNy8wMS9SZWdFeC1sb3ZlaGF0ZS5qcGc","dpr":1,"width":960},{"url":"https://tproger.ru/signed_image/iGAbtmFc-hjIeeiinb-qtMtXABexhRAPq8kACqVbMv4/rs:fill:466:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAxNy8wMS9SZWdFeC1sb3ZlaGF0ZS5qcGc","dpr":1,"width":466},{"url":"https://tproger.ru/signed_image/iQedOlu3X1QRoSKoQTOVx3y7h2LzXCNH2fO_eE-0FWQ/rs:fill:932:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAxNy8wMS9SZWdFeC1sb3ZlaGF0ZS5qcGc","dpr":1,"width":932}],"sizes":[{"media":"(min-width: 1441px)","size":"480px"},{"media":"(min-width: 1281px)","size":"480px"},{"media":"(min-width: 1281px)","size":"480px"},{"media":"(min-width: 961px)","size":"480px"},{"media":"(min-width: 671px)","size":"480px"},{"media":"(min-width: 500px)","size":"466px"}]}}}},{"id":"i8sPRkfo1T","type":"header3","data":{"text":"Перечисление","level":3},"tunes":{}},{"id":"UVMs9L0anH","type":"paragraph","data":{"text":"Чтобы проверить, удовлетворяет ли строка хотя бы одному из шаблонов, можно воспользоваться аналогом булевого оператора OR, который записывается с помощью символа |. Так, под шаблон Анна|Одиночество попадают строки “Анна” и “Одиночество” соответственно. Особенно удобно использовать перечисления внутри скобочных групп. Так, например (?:a|b|c|d) полностью эквивалентно [abcd] (в данном случае второй вариант предпочтительнее в силу производительности и читаемости)."}},{"id":"_pxzeCK7Zh","type":"paragraph","data":{"text":"С помощью этого оператора мы сможем добавить к нашему регулярному выражению для поиска междометий возможность распознавать смех вида “Ахахаах” — единственной усмешке, которая начинается с гласной: [Хх]([аоие])х?(?:\\1х?)*|[Аа]х?(?:ах?)+"}},{"id":"y6eqEs02IW","type":"header2","data":{"text":"Полезные сервисы","level":2},"tunes":{}},{"id":"M4OA1bYf91","type":"paragraph","data":{"text":"Потренироваться и/или проверить регулярное выражение на каком-либо тексте без написания кода можно с помощью таких сервисов, как RegExr, Regexpal или Regex101. Последний вдобавок приводит краткие пояснения к тому, как работает регулярка."}},{"id":"AXrMIdBrim","type":"paragraph","data":{"text":"Разобраться, как работает регулярное выражение, которое попало к вам в руки, можно с помощью сервиса Regexper — он умеет строить понятные диаграмы по регуляркам."}},{"id":"Zh6p6oV53y","type":"paragraph","data":{"text":"RegExp Builder — визуальный конструктор функций JavaScript для работы с регулярными выражениями."}},{"id":"3fed7aec-fe9e-4fda-87d4-00b932721d30","type":"banner-blank","data":{}},{"id":"43cAc-qI3d","type":"paragraph","data":{"text":"Больше инструментов можно найти в нашей подборке."}},{"id":"NETab4zlyt","type":"header2","data":{"text":"Задания для закрепления","level":2},"tunes":{}},{"id":"hfxkV_n2So","type":"header3","data":{"text":"Найдите время","level":3},"tunes":{}},{"id":"9hbWdTzcmU","type":"paragraph","data":{"text":"Время имеет формат часы:минуты. И часы, и минуты состоят из двух цифр, пример: 09:00. Напишите RegEx выражение для поиска времени в строке: “Завтрак в 09:00”. Учтите, что “37:98” — некорректное время."}},{"id":"j6Hgmak-ra","type":"accordion","data":{"id":"tp-accordion-b000e301-e630-49ba-8a84-00edc813526b","title":"Решение","content":"{\"time\":1743071912595,\"blocks\":[{\"id\":\"Ro40RG5O9U\",\"type\":\"code\",\"data\":{\"code\":\"(2[0-3]|[0-1]\\\\d):[0-5]\\\\d\",\"language\":\"html\",\"lineNumbers\":false,\"startLineNumber\":1,\"stretched\":false}}],\"version\":\"2.25.0\"}"}},{"id":"MzT86pvipb","type":"header3","data":{"text":"Java[^script]","level":3},"tunes":{}},{"id":"5o0D6ZTErJ","type":"paragraph","data":{"text":"Найдет ли регулярка Java[^script] что-нибудь в строке Java? А в строке JavaScript?"}},{"id":"CRk7MbMa0d","type":"accordion","data":{"id":"tp-accordion-c831c084-399d-4fdc-a081-7cf5ae27a17b","title":"Решение","content":"{\"time\":1743071912595,\"blocks\":[{\"id\":\"wwjAmVH9IV\",\"type\":\"paragraph\",\"data\":{\"text\":\"Ответы: нет, да.\"}},{\"id\":\"T6r6uOnE9G\",\"type\":\"list\",\"data\":{\"style\":\"unordered\",\"items\":[\"В строке Java он ничего не найдёт, так как исключающие квадратные скобки в Java[^…] означают «один символ, кроме указанных». А после «Java» – конец строки, символов больше нет.\",\"Да, найдёт. Поскольку регэксп регистрозависим, то под [^script] вполне подходит символ “S”.\"]}}],\"version\":\"2.25.0\"}"}},{"id":"ShnlpJrkYf","type":"header3","data":{"text":"Цвет","level":3},"tunes":{}},{"id":"wC0FoeLcwk","type":"paragraph","data":{"text":"Напишите регулярное выражение для поиска HTML-цвета, заданного как #ABCDEF, то есть # и содержит затем 6 шестнадцатеричных символов."}},{"id":"jdV1Al2NI7","type":"accordion","data":{"id":"tp-accordion-9c9310b2-ccb6-4283-b5c2-e54c3790c401","title":"Решение","content":"{\"time\":1743071912595,\"blocks\":[{\"id\":\"ivu44IKwzs\",\"type\":\"paragraph\",\"data\":{\"text\":\"Итак, нужно написать выражение для описания цвета, который начинается с «#», за которым следуют 6 шестнадцатеричных символов. Шестнадцатеричный символ можно описать с помощью [0-9a-fA-F]. Для его шестикратного повторения мы будем использовать квантификатор {6}.\"}},{\"id\":\"cXFZSoSvg_\",\"type\":\"code\",\"data\":{\"code\":\"#[0-9a-fA-F]{6}\",\"language\":\"html\",\"lineNumbers\":false,\"startLineNumber\":1,\"stretched\":false}}],\"version\":\"2.25.0\"}"}},{"id":"qUNzQ6cQE5","type":"header3","data":{"text":"Разобрать арифметическое выражение","level":3},"tunes":{}},{"id":"5fwRfkBK5K","type":"paragraph","data":{"text":"Арифметическое выражение состоит из двух чисел и операции между ними, например:"}},{"id":"dsP5E6G2U4","type":"list","data":{"style":"unordered","items":["1 + 2","1.2 *3.4","-3/ -6","-2-2"]}},{"id":"XgAH_L3Qof","type":"paragraph","data":{"text":"Список операций: “+”, «-», “*” и “/”."}},{"id":"TLyV28a-BZ","type":"paragraph","data":{"text":"Также могут присутствовать пробелы вокруг оператора и чисел."}},{"id":"G-9K1pM-LJ","type":"paragraph","data":{"text":"Напишите регулярку, которая найдёт, как всё арифметическое действие, так и (через группы) два операнда."}},{"id":"Jy9fSAD-fA","type":"accordion","data":{"id":"tp-accordion-f8320b7b-5ac4-4cdd-9616-4ce0ba37d644","title":"Решение","content":"{\"time\":1743071912595,\"blocks\":[{\"id\":\"vwrw_Cw-YX\",\"type\":\"paragraph\",\"data\":{\"text\":\"Регулярное выражение для числа, возможно, дробного и отрицательного: -?\\\\d+(\\\\.\\\\d+)?.\"}},{\"id\":\"V0CjXKr0Ow\",\"type\":\"paragraph\",\"data\":{\"text\":\"Оператор – это [+*/\\\\-]. Заметим, что дефис мы экранируем. Нам нужно число, затем оператор, затем число, и необязательные пробелы между ними. Чтобы получить результат в требуемом формате, добавим ?: к группам, поиск по которым нам не интересен (отдельно дробные части), а операнды наоборот заключим в скобки. В итоге:\"}},{\"id\":\"o_3ozqNUyL\",\"type\":\"code\",\"data\":{\"code\":\"(-?\\\\d+(?:\\\\.\\\\d+)?)\\\\s*([-+*\\\\/])\\\\s*(-?\\\\d+(?:\\\\.\\\\d+)?)\",\"language\":\"html\",\"lineNumbers\":false,\"startLineNumber\":1,\"stretched\":false}}],\"version\":\"2.25.0\"}"}},{"id":"oUazSLhItM","type":"header3","data":{"text":"Кроссворды из регулярных выражений","level":3},"tunes":{}},{"id":"7e8nt4q-sn","type":"paragraph","data":{"text":"Такие кроссворды вы можете найти у нас."}},{"id":"r2sYTz_5hx","type":"separator","data":{"text":"***"}},{"id":"EwzPp4-rsp","type":"paragraph","data":{"text":"Удачи и помните — не всегда задачу стоит решать именно с помощью регекспов (“У программиста была проблема, которую он начал решать регэкспами. Теперь у него две проблемы”). Иногда лучше, например, написать развёрнутый автомат конечных состояний."}}],"version":"2.25.0"}

Ошибка в настройках сайта