{"blocks":[{"type":"expertLegacy","data":{"id":"1406"}},{"type":"paragraph","data":{"text":"Приветствую всех, принадлежащих к клубу «Тыжпрограммист, почини утюг», а также просто интересующихся IT-миром!"}},{"type":"paragraph","data":{"text":"В этой статье мы рассмотрим инструмент, с помощью которого можно прорываться через мусор в тексте. А также фильтровать контент и названия файлов, отлавливать запрещённые/разрешенные команды, парсить SQL-запросы и выпендриваться перед коллегами. Это регулярные выражения ?"}},{"type":"paragraph","data":{"text":"Все примеры описаны для языка Golang, однако общие принципы, синтаксис самих регулярных выражений применимы и к других языкам программирования."}},{"type":"header2","data":{"level":2,"text":"В начале было слово…"}},{"type":"paragraph","data":{"text":"И слово это – паника. Давайте сперва запомним, как надёжней начинать работу с регулярными выражениями. Рассмотрим простейший пример:"}},{"type":"code","data":{"code":"_ = regexp.MustCompile(`+++`)","language":"go lazy-code"}},{"type":"paragraph","data":{"text":"Запустив сей код легким мановением руки… получим то, что всей душой ненавидят пишущие на golang люди — панику. Дело в том, что MustCompile паникует вместо возврата ошибки, как это сделано, например, в методе Compile из того же пакета."}},{"type":"paragraph","data":{"text":"Поэтому MustCompile рекомендуется использовать только в тех случаях, когда:"}},{"type":"list","data":{"items":["вы на 100% уверены, что регулярное выражение валидно;","вы очень хотите упростить код с инициализацией каких-нибудь глобальных переменных."],"style":"unordered"}},{"type":"paragraph","data":{"text":"В остальных случаях лучше подойдёт вариант с возвратом ошибки."}},{"type":"code","data":{"code":"_, err := regexp.Compile(`+++`)\r\nif err != nil { fmt.Println(err) } // error parsing regexp: missing \r\nargument to repetition operator: `+`","language":"go lazy-code"}},{"type":"paragraph","data":{"text":"Простой пример проверки соответствия (который можно скопировать и поломать):"}},{"type":"code","data":{"code":"matched, _ := regexp.MatchString(`ayayay`, \"o no\") // пустой «приемник» ошибки, ведь мы уверены, что пример отработает нормально\r\nfmt.Println(matched) // false","language":"go lazy-code"}},{"type":"header2","data":{"level":2,"text":"Общая информация"}},{"type":"list","data":{"items":["Немного общих сведений о регулярных выражениях в Golang (regexp пакет):","синтаксис RE2 (библиотека регулярок от Google);","кодировка UTF-8 и классы символов Unicode;","время выполнения линейно зависимо от размера ввода;","обратные ссылки не поддерживаются (не думайте об этом, просто положите на полочку в своих «чертогах разума», чуть позже будет объяснение);","для регулярных выражений лучше использовать (аккуратно, ведь там своя специфика) необработанные строки (raw strings, строки без интерпретации экранированных литералов)."],"style":"unordered"}},{"type":"paragraph","data":{"text":"А теперь приступим к более подробному разбору темы."}},{"type":"header3","data":{"level":3,"text":"Простые совпадения"}},{"type":"image","data":{"file":{"id":167043,"url":"https://media.tproger.ru/uploads/2021/07/Snimok1.jpg"},"alt":"","title":"","caption":"","stretched":false,"withBackground":false,"withBorder":false,"width":660,"height":114,"optimizedFile":{"original":"https://media.tproger.ru/uploads/2021/07/Snimok1.jpg","alt":"Путешествие в golang regexp 1","dimensions":{"width":660,"height":114},"additionalSizes":{"srcSet":[{"url":"https://tproger.ru/signed_image/LZ2vrWVhoApsn7Lv4tFdKg58D5rCyKORvZroDonk5wk/rs:fill:660:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAyMS8wNy9Tbmltb2sxLmpwZw=","dpr":1,"width":660},{"url":"https://tproger.ru/signed_image/7PhpAsdfzSI2dPC6S69oWKjkhZf3R24_eLBJtR4-4Go/rs:fill:1320:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAyMS8wNy9Tbmltb2sxLmpwZw=","dpr":1,"width":1320},{"url":"https://tproger.ru/signed_image/LZ2vrWVhoApsn7Lv4tFdKg58D5rCyKORvZroDonk5wk/rs:fill:660:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAyMS8wNy9Tbmltb2sxLmpwZw=","dpr":1,"width":660},{"url":"https://tproger.ru/signed_image/7PhpAsdfzSI2dPC6S69oWKjkhZf3R24_eLBJtR4-4Go/rs:fill:1320:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAyMS8wNy9Tbmltb2sxLmpwZw=","dpr":1,"width":1320},{"url":"https://tproger.ru/signed_image/lUnlVJQ1c9JilL1bzz-bhKQXAuasCIT3N49M_W_If40/rs:fill:636:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAyMS8wNy9Tbmltb2sxLmpwZw=","dpr":1,"width":636},{"url":"https://tproger.ru/signed_image/lkol34C4vEjqNQqh_AdWVO2ckb-yFz1QlIarv_SHLgA/rs:fill:1272:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAyMS8wNy9Tbmltb2sxLmpwZw=","dpr":1,"width":1272},{"url":"https://tproger.ru/signed_image/wKMg7BQlkq4aWdOHfIll0SwSeM9TmuGYxWr8U38gnks/rs:fill:466:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAyMS8wNy9Tbmltb2sxLmpwZw=","dpr":1,"width":466},{"url":"https://tproger.ru/signed_image/5OsVK8JGQ5rmUskTI2NpYWdoDLU0X-pAYvxHkOrQAHw/rs:fill:932:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAyMS8wNy9Tbmltb2sxLmpwZw=","dpr":1,"width":932}],"sizes":[{"media":"(min-width: 1441px)","size":"660px"},{"media":"(min-width: 1281px)","size":"660px"},{"media":"(min-width: 1281px)","size":"660px"},{"media":"(min-width: 961px)","size":"660px"},{"media":"(min-width: 671px)","size":"636px"},{"media":"(min-width: 500px)","size":"466px"}]}}}},{"type":"paragraph","data":{"text":"Простые совпадения не несут в себе никакого тайного смысла. Что написано – то и ищем."}},{"type":"paragraph","data":{"text":"В дальнейшем в простых примерах будем использовать функции:"}},{"type":"list","data":{"items":["MatchString (проверяет, есть ли в строке вхождения регулярного выражения);","FindAllString (ищет все последовательные непересекающиеся повторения в
строке)."],"style":"unordered"}},{"type":"paragraph","data":{"text":"Регулярные выражения будут выделяться синим цветом, а комментарии — серым для создания качественных нейронных связей в голове читателя."}},{"type":"code","data":{"code":"matched, _ := regexp.MatchString(`I am here`, \"I am there\")\r\nfmt.Println(matched) // false","language":"go lazy-code"}},{"type":"paragraph","data":{"text":"Совпадение не полное, в последнем слове лишняя «t»."}},{"type":"code","data":{"code":"matched, _ := regexp.MatchString(`Banana`, \"Banana\")\r\nfmt.Println(matched) // true","language":"go lazy-code"}},{"type":"paragraph","data":{"text":"«Banana» полностью совпадает со строкой."}},{"type":"code","data":{"code":"matched, _ := regexp.MatchString(`cat`, \"black cat meow\")\r\nfmt.Println(matched) // true","language":"go lazy-code"}},{"type":"paragraph","data":{"text":"«сat» встречается в строке."}},{"type":"code","data":{"code":"re, _ := regexp.Compile(`cat`)\r\nres := re.FindAllString(\"black cat meowcat\", -1)\r\nfmt.Println(res) // [cat cat]","language":"go lazy-code"}},{"type":"paragraph","data":{"text":"Находятся два вхождения."}},{"type":"header3","data":{"level":3,"text":"Якори границ"}},{"type":"image","data":{"file":{"id":167049,"url":"https://media.tproger.ru/uploads/2021/07/Snimok2.jpg"},"alt":"","title":"","caption":"","stretched":false,"withBackground":false,"withBorder":false,"width":660,"height":165,"optimizedFile":{"original":"https://media.tproger.ru/uploads/2021/07/Snimok2.jpg","alt":"Путешествие в golang regexp 2","dimensions":{"width":660,"height":165},"additionalSizes":{"srcSet":[{"url":"https://tproger.ru/signed_image/w1XCLLp8uQ2DDpW853b9EF93Ukw_rlzAoqCPamGZ-gE/rs:fill:660:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAyMS8wNy9Tbmltb2syLmpwZw=","dpr":1,"width":660},{"url":"https://tproger.ru/signed_image/-tqbB_TeHcdeVHBUIaxLKfj0tyDWiPHe-X6ZW5NOuw8/rs:fill:1320:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAyMS8wNy9Tbmltb2syLmpwZw=","dpr":1,"width":1320},{"url":"https://tproger.ru/signed_image/w1XCLLp8uQ2DDpW853b9EF93Ukw_rlzAoqCPamGZ-gE/rs:fill:660:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAyMS8wNy9Tbmltb2syLmpwZw=","dpr":1,"width":660},{"url":"https://tproger.ru/signed_image/-tqbB_TeHcdeVHBUIaxLKfj0tyDWiPHe-X6ZW5NOuw8/rs:fill:1320:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAyMS8wNy9Tbmltb2syLmpwZw=","dpr":1,"width":1320},{"url":"https://tproger.ru/signed_image/aLmWLo18N8W7KQ-H1NkNU2H1dGT2j7ZpZEYqkikoVj4/rs:fill:636:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAyMS8wNy9Tbmltb2syLmpwZw=","dpr":1,"width":636},{"url":"https://tproger.ru/signed_image/8FNIGks-p2bPDbVHJrAVioGd1v6KgwPp5cMaoDqiiYI/rs:fill:1272:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAyMS8wNy9Tbmltb2syLmpwZw=","dpr":1,"width":1272},{"url":"https://tproger.ru/signed_image/IFlxHGHWkO5HJIeknzLkDV_KJ75ZeHfqFOuZ4WPEbVQ/rs:fill:466:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAyMS8wNy9Tbmltb2syLmpwZw=","dpr":1,"width":466},{"url":"https://tproger.ru/signed_image/EAjUvjbLCLlCY2mBz4Ek2ML8VxZj_ogrj5S9E9AtL3A/rs:fill:932:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAyMS8wNy9Tbmltb2syLmpwZw=","dpr":1,"width":932}],"sizes":[{"media":"(min-width: 1441px)","size":"660px"},{"media":"(min-width: 1281px)","size":"660px"},{"media":"(min-width: 1281px)","size":"660px"},{"media":"(min-width: 961px)","size":"660px"},{"media":"(min-width: 671px)","size":"636px"},{"media":"(min-width: 500px)","size":"466px"}]}}}},{"type":"paragraph","data":{"text":"Якори границ позволяют нам делить текст на отдельные слова, явно задавать привязку к началу или концу строки/текста."}},{"type":"code","data":{"code":"matched, _ := regexp.MatchString(`^I am here`, \" I am here\")\r\nfmt.Println(matched) // false","language":"go lazy-code"}},{"type":"paragraph","data":{"text":"Ищем текст, начинающийся с «I am here», но есть пробел перед «I» – не подходит."}},{"type":"code","data":{"code":"matched, _ := regexp.MatchString(`^cat$`, \"Black cat meow\")\r\nfmt.Println(matched) // false","language":"go lazy-code"}},{"type":"paragraph","data":{"text":"Ищем строку, состоящую только из кота — но он в середине."}},{"type":"code","data":{"code":"matched, _ := regexp.MatchString(`\\bcat\\b`, \"Black cat meow\")\r\nfmt.Println(matched) // true","language":"go lazy-code"}},{"type":"paragraph","data":{"text":"Ищем кота отдельным словом — находим."}},{"type":"code","data":{"code":"matched, _ := regexp.MatchString(`\\Bcat\\b`, \"Blackcat meow\")\r\nfmt.Println(matched) // true","language":"go lazy-code"}},{"type":"paragraph","data":{"text":"Ищем что-то, заканчивающееся котом — находим."}},{"type":"header3","data":{"level":3,"text":"Классы символов (воин, маг, лучник)"}},{"type":"image","data":{"file":{"id":167054,"url":"https://media.tproger.ru/uploads/2021/07/Snimok3.jpg"},"alt":"","title":"","caption":"","stretched":false,"withBackground":false,"withBorder":false,"width":648,"height":201,"optimizedFile":{"original":"https://media.tproger.ru/uploads/2021/07/Snimok3.jpg","alt":"Путешествие в golang regexp 3","dimensions":{"width":648,"height":201},"additionalSizes":{"srcSet":[{"url":"https://tproger.ru/signed_image/RwXp3OhfT7lH68sqkQyTh6XsDlEzgywHqsy9IHJDTHo/rs:fill:648:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAyMS8wNy9Tbmltb2szLmpwZw=","dpr":1,"width":648},{"url":"https://tproger.ru/signed_image/XVEP0vE6tUi115g1135yIFnVD44ctNyCfjE9cBXWtqU/rs:fill:1296:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAyMS8wNy9Tbmltb2szLmpwZw=","dpr":1,"width":1296},{"url":"https://tproger.ru/signed_image/RwXp3OhfT7lH68sqkQyTh6XsDlEzgywHqsy9IHJDTHo/rs:fill:648:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAyMS8wNy9Tbmltb2szLmpwZw=","dpr":1,"width":648},{"url":"https://tproger.ru/signed_image/XVEP0vE6tUi115g1135yIFnVD44ctNyCfjE9cBXWtqU/rs:fill:1296:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAyMS8wNy9Tbmltb2szLmpwZw=","dpr":1,"width":1296},{"url":"https://tproger.ru/signed_image/a9CKpAwsaHNxLCwllrSQg9nq13iqxS3tBzraBsxo5W8/rs:fill:636:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAyMS8wNy9Tbmltb2szLmpwZw=","dpr":1,"width":636},{"url":"https://tproger.ru/signed_image/pVOnbKjfG_P_g-gl5PVq70gXke0gE8HiindEYKQazXg/rs:fill:1272:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAyMS8wNy9Tbmltb2szLmpwZw=","dpr":1,"width":1272},{"url":"https://tproger.ru/signed_image/AaJfYqTrOVfugtNcXk8f1MVL5kik0Ae3P4jl01gaamg/rs:fill:466:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAyMS8wNy9Tbmltb2szLmpwZw=","dpr":1,"width":466},{"url":"https://tproger.ru/signed_image/yUSWarber9b8IoQxFqHMFOGP5CihCvR5IDpdGbyXkV4/rs:fill:932:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAyMS8wNy9Tbmltb2szLmpwZw=","dpr":1,"width":932}],"sizes":[{"media":"(min-width: 1441px)","size":"648px"},{"media":"(min-width: 1281px)","size":"648px"},{"media":"(min-width: 1281px)","size":"648px"},{"media":"(min-width: 961px)","size":"648px"},{"media":"(min-width: 671px)","size":"636px"},{"media":"(min-width: 500px)","size":"466px"}]}}}},{"type":"paragraph","data":{"text":"Классы — это краткая запись перечисления символов, объединённых по какому-либо признаку. Также можно использовать posix классы ([:digit:], [:space:], etc.), если так удобней."}},{"type":"code","data":{"code":"matched, _ := regexp.MatchString(`.....`, \"any trash with 5 chars\")\r\nfmt.Println(matched) // true","language":"go lazy-code"}},{"type":"paragraph","data":{"text":"Ищем вхождение пяти любых символов."}},{"type":"code","data":{"code":"matched, _ := regexp.MatchString(`^\\w\\wow\\d\\b.\\D\\Dow\\d$`, \"meow3_meow4\")\r\nfmt.Println(matched) // false","language":"go lazy-code"}},{"type":"paragraph","data":{"text":"Ищем вхождения сочетаний: «ow<цифра><конец слова>» через два символа слова с начала строки, любой символ, затем две НЕ цифры, затем снова «ow», цифра, конец."}},{"type":"code","data":{"code":"matched, _ := regexp.MatchString(`^...@_\\w\\wD$`, \"rus@_UPD\")\r\nfmt.Println(matched) // true","language":"go lazy-code"}},{"type":"paragraph","data":{"text":"Ищем начало текста, три любых символа, «@_», два символа слова, «D», конец."}},{"type":"code","data":{"code":"matched, _ := regexp.MatchString(`^GO\\s\\d.\\d\\d$`, \"GO 1.16\")\r\nfmt.Println(matched) // true","language":"go lazy-code"}},{"type":"paragraph","data":{"text":"Ищем начало текста, «GO», один пробельный символ, одну цифру, любой символ, две цифры, конец."}},{"type":"header3","data":{"level":3,"text":"Специальные символы и escape"}},{"type":"image","data":{"file":{"id":167060,"url":"https://media.tproger.ru/uploads/2021/07/Snimok4.jpg"},"alt":"","title":"","caption":"","stretched":false,"withBackground":false,"withBorder":false,"width":641,"height":203,"optimizedFile":{"original":"https://media.tproger.ru/uploads/2021/07/Snimok4.jpg","alt":"Путешествие в golang regexp 4","dimensions":{"width":641,"height":203},"additionalSizes":{"srcSet":[{"url":"https://tproger.ru/signed_image/VDirP8Xe5KddB9CMGJm0vdtwoEPF6MupPnsMEKJ6Gmk/rs:fill:641:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAyMS8wNy9Tbmltb2s0LmpwZw=","dpr":1,"width":641},{"url":"https://tproger.ru/signed_image/r71kr58kGXz3sw5xOT4x1TsbbKOGEmUNWkbfpH2_1FU/rs:fill:1282:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAyMS8wNy9Tbmltb2s0LmpwZw=","dpr":1,"width":1282},{"url":"https://tproger.ru/signed_image/VDirP8Xe5KddB9CMGJm0vdtwoEPF6MupPnsMEKJ6Gmk/rs:fill:641:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAyMS8wNy9Tbmltb2s0LmpwZw=","dpr":1,"width":641},{"url":"https://tproger.ru/signed_image/r71kr58kGXz3sw5xOT4x1TsbbKOGEmUNWkbfpH2_1FU/rs:fill:1282:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAyMS8wNy9Tbmltb2s0LmpwZw=","dpr":1,"width":1282},{"url":"https://tproger.ru/signed_image/1D2UTl_50G0IUbVkJ4mbI6ygVrdciW4OrZrFGpleu38/rs:fill:636:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAyMS8wNy9Tbmltb2s0LmpwZw=","dpr":1,"width":636},{"url":"https://tproger.ru/signed_image/yInKE-e0QJbx14mz8BrOnb1lbOJmHSYzjHxAxqBGlQw/rs:fill:1272:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAyMS8wNy9Tbmltb2s0LmpwZw=","dpr":1,"width":1272},{"url":"https://tproger.ru/signed_image/lPHO27rjK2PB13GwDnANOHG5m4eeqPVUcyrHdwcOaek/rs:fill:466:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAyMS8wNy9Tbmltb2s0LmpwZw=","dpr":1,"width":466},{"url":"https://tproger.ru/signed_image/Xah_6DC0IipSNoY2YnNvHXz117OFYitKp9ZUwrRz_Fw/rs:fill:932:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAyMS8wNy9Tbmltb2s0LmpwZw=","dpr":1,"width":932}],"sizes":[{"media":"(min-width: 1441px)","size":"641px"},{"media":"(min-width: 1281px)","size":"641px"},{"media":"(min-width: 1281px)","size":"641px"},{"media":"(min-width: 961px)","size":"641px"},{"media":"(min-width: 671px)","size":"636px"},{"media":"(min-width: 500px)","size":"466px"}]}}}},{"type":"paragraph","data":{"text":"Что нужно знать про специальные символы:"}},{"type":"list","data":{"items":["список спецсимволов: ^ $ * + ? { } [ ] \\ | ( )","их нужно экранировать с помощью `\\`, т.е. `\\+` = просто +"],"style":"unordered"}},{"type":"code","data":{"code":"matched, _ := regexp.MatchString(`^I\\nam\\nhere$`, \"I\\nam\\nhere\")\r\nfmt.Println(matched) // true","language":"go lazy-code"}},{"type":"paragraph","data":{"text":"Ищем «I» в начале текста, перенос, «am», перенос, «here», конец текста."}},{"type":"code","data":{"code":"matched, _ := regexp.MatchString(`^\\x49\\nam\\nhere$`, \"I\\nam\\nhere\")\r\nfmt.Println(matched) // true","language":"go lazy-code"}},{"type":"paragraph","data":{"text":"Ищем «I» (в виде 16-ричного кода символа), в начале текста, перенос, «am», перенос, «here», конец текста."}},{"type":"code","data":{"code":"matched, _ := regexp.MatchString(`a+b=c`, \"a+b=c\")\r\nfmt.Println(matched) // false","language":"go lazy-code"}},{"type":"paragraph","data":{"text":"Ищем… не «a+b=c», а одно и более повторение «a», «b=c», ибо «+» не экранирован."}},{"type":"code","data":{"code":"matched, _ := regexp.MatchString(`a\\|b=c`, \"a|b=c\")\r\nfmt.Println(matched) // true","language":"go lazy-code"}},{"type":"paragraph","data":{"text":"Ищем «a|b=c», символ «|» экранирован, всё в порядке."}},{"type":"header3","data":{"level":3,"text":"Повторение (жабное, не жабное)"}},{"type":"image","data":{"file":{"id":167065,"url":"https://media.tproger.ru/uploads/2021/07/Snimok5.jpg"},"alt":"","title":"","caption":"","stretched":false,"withBackground":false,"withBorder":false,"width":647,"height":229,"optimizedFile":{"original":"https://media.tproger.ru/uploads/2021/07/Snimok5.jpg","alt":"Путешествие в golang regexp 5","dimensions":{"width":647,"height":229},"additionalSizes":{"srcSet":[{"url":"https://tproger.ru/signed_image/TvJL5abqs1s3oLVIth2NIsbXY9GQbrdhRmMd0bBsZg4/rs:fill:647:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAyMS8wNy9Tbmltb2s1LmpwZw=","dpr":1,"width":647},{"url":"https://tproger.ru/signed_image/O7iR2l94xmjEVZmkJBUbyuXG5v5Oc3_CWT1GVR8WXho/rs:fill:1294:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAyMS8wNy9Tbmltb2s1LmpwZw=","dpr":1,"width":1294},{"url":"https://tproger.ru/signed_image/TvJL5abqs1s3oLVIth2NIsbXY9GQbrdhRmMd0bBsZg4/rs:fill:647:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAyMS8wNy9Tbmltb2s1LmpwZw=","dpr":1,"width":647},{"url":"https://tproger.ru/signed_image/O7iR2l94xmjEVZmkJBUbyuXG5v5Oc3_CWT1GVR8WXho/rs:fill:1294:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAyMS8wNy9Tbmltb2s1LmpwZw=","dpr":1,"width":1294},{"url":"https://tproger.ru/signed_image/UZl1IGvEDSkLD839xHB6cFNhTXXJddrA-L475wXBlmI/rs:fill:636:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAyMS8wNy9Tbmltb2s1LmpwZw=","dpr":1,"width":636},{"url":"https://tproger.ru/signed_image/CB82Qan4pAe1i9RRgVR1c7WQGxQiSB6ne89bRNGa-W0/rs:fill:1272:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAyMS8wNy9Tbmltb2s1LmpwZw=","dpr":1,"width":1272},{"url":"https://tproger.ru/signed_image/GmS7iSgXfkqo7X3x4nQth06htbvGXGQ_dgurtTbL9kQ/rs:fill:466:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAyMS8wNy9Tbmltb2s1LmpwZw=","dpr":1,"width":466},{"url":"https://tproger.ru/signed_image/teXFL1A16Tl88UOD3p3-P0riSKGVAYqPmCg9M6d49n4/rs:fill:932:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAyMS8wNy9Tbmltb2s1LmpwZw=","dpr":1,"width":932}],"sizes":[{"media":"(min-width: 1441px)","size":"647px"},{"media":"(min-width: 1281px)","size":"647px"},{"media":"(min-width: 1281px)","size":"647px"},{"media":"(min-width: 961px)","size":"647px"},{"media":"(min-width: 671px)","size":"636px"},{"media":"(min-width: 500px)","size":"466px"}]}}}},{"type":"paragraph","data":{"text":"Повторения являются, пожалуй, одной из важнейших фич при работе с регулярными выражениями. Как минимум, из-за того, что дают возможность исключать некоторые подвыражения из обязательных (при использовании?). ЖаБным оно стало в связи со случайной опечаткой и осознанием, что так запоминается лучше."}},{"type":"code","data":{"code":"re, _ := regexp.Compile(`\\d+`)\r\nres := re.FindAllString(\"A123AA455AAA2A89\", -1)\r\nfmt.Println(res) // [123 455 2 89]","language":"go lazy-code"}},{"type":"paragraph","data":{"text":"Ищем все вхождения чисел из одной и более цифр."}},{"type":"code","data":{"code":"matched, _ := regexp.MatchString(`^A{1}G{1,3}A{1,}!{,2}$`, \"AGGAA!!\")\r\nfmt.Println(matched) // false (вероятно, бага, будьте осторожны, only python, с {0,2} поведение корректно)","language":"go lazy-code"}},{"type":"paragraph","data":{"text":"Ищем начало текста, одно повторение «А», от одного до 3 повторений «G», одно и более повторение «А», от 0 до 2 повторений «!»."}},{"type":"code","data":{"code":"re, _ := regexp.Compile(`<.*>`)\r\nres := re.FindAllString(\"

Golang VS Python

\", -1)\r\nfmt.Println(res) // [

Golang VS Python

] (len=1) :(","language":"go lazy-code"}},{"type":"paragraph","data":{"text":"Пытаемся найти все вхождения тегов — из-за жадного повторения получаем весь текст как первое вхождение, ибо весь текст также соответствует выражению <.*> — начинается скобкой, дальше имеет 0 и более любых символов, заканчивается скобкой."}},{"type":"code","data":{"code":"re, _ := regexp.Compile(`<.*?>`)\r\nres := re.FindAllString(\"

Golang VS Python

\", -1)\r\nfmt.Println(res) // [

] :)","language":"go lazy-code"}},{"type":"paragraph","data":{"text":"Пытаемся найти все вхождения тегов, используя не жадное повторение — происходит магия, все срабатывает."}},{"type":"header3","data":{"level":3,"text":"Квадратные скобки, ИЛИ и НЕ"}},{"type":"image","data":{"file":{"id":168118,"url":"https://media.tproger.ru/uploads/2021/07/Snimok6.jpg"},"alt":"","title":"","caption":"","stretched":false,"withBackground":false,"withBorder":false,"width":638,"height":235,"optimizedFile":{"original":"https://media.tproger.ru/uploads/2021/07/Snimok6.jpg","alt":"Путешествие в golang regexp 6","dimensions":{"width":638,"height":235},"additionalSizes":{"srcSet":[{"url":"https://tproger.ru/signed_image/d1eBi3aWJZW6_oMIV0FTGyW4f1aUNNV9RmcSIYs8bkU/rs:fill:638:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAyMS8wNy9Tbmltb2s2LmpwZw=","dpr":1,"width":638},{"url":"https://tproger.ru/signed_image/VWfWEP6jZIyS-j_CYJTaCozzYZU1PLtyCDUQ6wocYg0/rs:fill:1276:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAyMS8wNy9Tbmltb2s2LmpwZw=","dpr":1,"width":1276},{"url":"https://tproger.ru/signed_image/d1eBi3aWJZW6_oMIV0FTGyW4f1aUNNV9RmcSIYs8bkU/rs:fill:638:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAyMS8wNy9Tbmltb2s2LmpwZw=","dpr":1,"width":638},{"url":"https://tproger.ru/signed_image/VWfWEP6jZIyS-j_CYJTaCozzYZU1PLtyCDUQ6wocYg0/rs:fill:1276:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAyMS8wNy9Tbmltb2s2LmpwZw=","dpr":1,"width":1276},{"url":"https://tproger.ru/signed_image/-HBr7gNFX0p6eEYEWc75BkVk9378r1lL7pIIjFC7kXI/rs:fill:636:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAyMS8wNy9Tbmltb2s2LmpwZw=","dpr":1,"width":636},{"url":"https://tproger.ru/signed_image/43eVbfOjo8ukizHo2djC6CMTX5jYV31NLj9i3jliFVU/rs:fill:1272:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAyMS8wNy9Tbmltb2s2LmpwZw=","dpr":1,"width":1272},{"url":"https://tproger.ru/signed_image/7hqKBAFVYtXLXHCdzuyKFT8YRuqIr8uwBFbEmm___0s/rs:fill:466:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAyMS8wNy9Tbmltb2s2LmpwZw=","dpr":1,"width":466},{"url":"https://tproger.ru/signed_image/kIzclYG0Rc6jcmHjMLfBZGT8c9G7idmSG3fZA4Sr6DU/rs:fill:932:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAyMS8wNy9Tbmltb2s2LmpwZw=","dpr":1,"width":932}],"sizes":[{"media":"(min-width: 1441px)","size":"638px"},{"media":"(min-width: 1281px)","size":"638px"},{"media":"(min-width: 1281px)","size":"638px"},{"media":"(min-width: 961px)","size":"638px"},{"media":"(min-width: 671px)","size":"636px"},{"media":"(min-width: 500px)","size":"466px"}]}}}},{"type":"paragraph","data":{"text":"Квадратные скобки эквивалентны перечислению (перечислению с отрицанием при использовании ^). Прямая черта | равнозначна набору альтернативных вариантов из слов. Крышечкой ^ обозначается отрицание при использовании внутри квадратных скобок."}},{"type":"code","data":{"code":"matched, _ := regexp.MatchString(`good|bad|[^ice\\s]$`, \"work is hmm\")\r\nfmt.Println(matched) // true","language":"go lazy-code"}},{"type":"paragraph","data":{"text":"Ищем либо «good», либо «bad», либо один символ в конце текста, не являющийся пробельным, «i», «c» или «e»."}},{"type":"code","data":{"code":"matched, _ := regexp.MatchString(`^[aAuUfF]*?go|python [1-3]\\.\\d$`, \"Uf go 1.6\")\r\nfmt.Println(matched) // false","language":"go lazy-code"}},{"type":"paragraph","data":{"text":"Ищем начало текста, ноль или более (лучше меньше, не жадное повторение) символов из перечня [a, A , u , U , f ,F], «go» или «python», пробел, от одной до трех цифр, точку, одну цифру и конец текста)."}},{"type":"code","data":{"code":"matched, _ := regexp.MatchString(`^[haHA]+$`, \"HahaHaaaahaaaaaaa\")\r\nfmt.Println(matched) // true","language":"go lazy-code"}},{"type":"paragraph","data":{"text":"Ищем начало текста, один и более символов из перечня [h, a, H, A], конец текста."}},{"type":"code","data":{"code":"matched, _ := regexp.MatchString(`^[haHA]+|[goGO]*$`, \"\")","language":"go lazy-code"}},{"type":"code","data":{"code":"fmt.Println(matched) // true","language":"go lazy-code"}},{"type":"paragraph","data":{"text":"Ищем начало текста, один и более символов из перечня [h, a, H, A] либо ноль и более символов из перечня [g, o, G, O], конец текста – пустая строка соответствует второму варианту после прямой черты."}},{"type":"header3","data":{"level":3,"text":"Группы"}},{"type":"image","data":{"file":{"id":168125,"url":"https://media.tproger.ru/uploads/2021/07/Snimok7.jpg"},"alt":"","title":"","caption":"","stretched":false,"withBackground":false,"withBorder":false,"width":638,"height":160,"optimizedFile":{"original":"https://media.tproger.ru/uploads/2021/07/Snimok7.jpg","alt":"Путешествие в golang regexp 7","dimensions":{"width":638,"height":160},"additionalSizes":{"srcSet":[{"url":"https://tproger.ru/signed_image/16Mzn-1hTzEI31Utd2WC9XoeCepwDp27G1L-SH-bqSI/rs:fill:638:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAyMS8wNy9Tbmltb2s3LmpwZw=","dpr":1,"width":638},{"url":"https://tproger.ru/signed_image/qQ775EjdZ1-jHYXA8St0q2L1MutbSQYMeSiHPFq9Aj4/rs:fill:1276:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAyMS8wNy9Tbmltb2s3LmpwZw=","dpr":1,"width":1276},{"url":"https://tproger.ru/signed_image/16Mzn-1hTzEI31Utd2WC9XoeCepwDp27G1L-SH-bqSI/rs:fill:638:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAyMS8wNy9Tbmltb2s3LmpwZw=","dpr":1,"width":638},{"url":"https://tproger.ru/signed_image/qQ775EjdZ1-jHYXA8St0q2L1MutbSQYMeSiHPFq9Aj4/rs:fill:1276:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAyMS8wNy9Tbmltb2s3LmpwZw=","dpr":1,"width":1276},{"url":"https://tproger.ru/signed_image/m6S7I9oYr76UkAtv5obYLcIpCA3cYhkY2PL2-DPV8kE/rs:fill:636:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAyMS8wNy9Tbmltb2s3LmpwZw=","dpr":1,"width":636},{"url":"https://tproger.ru/signed_image/iN_RxSmgM25XXTMYEXhanFR23kmgj8nySbNfXgR8yPc/rs:fill:1272:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAyMS8wNy9Tbmltb2s3LmpwZw=","dpr":1,"width":1272},{"url":"https://tproger.ru/signed_image/3wm_NDfBrAZ5pHXYafde7pey-tbqEYQ7p1_Fr92YLzM/rs:fill:466:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAyMS8wNy9Tbmltb2s3LmpwZw=","dpr":1,"width":466},{"url":"https://tproger.ru/signed_image/VWZeixaWmjF0jRvCsbGu7MMneODowJVkTshEefs973Y/rs:fill:932:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAyMS8wNy9Tbmltb2s3LmpwZw=","dpr":1,"width":932}],"sizes":[{"media":"(min-width: 1441px)","size":"638px"},{"media":"(min-width: 1281px)","size":"638px"},{"media":"(min-width: 1281px)","size":"638px"},{"media":"(min-width: 961px)","size":"638px"},{"media":"(min-width: 671px)","size":"636px"},{"media":"(min-width: 500px)","size":"466px"}]}}}},{"type":"paragraph","data":{"text":"Важное о группах:"}},{"type":"list","data":{"items":["позволяют поместить часть совпадения в отдельный массив;","квантификатор после скобок группы применяется ко всей группе (под квантификаторами подразумеваются такие товарищи, как: +, *, {min, max}, etc.);","группа 0 всегда относится ко всему выражению;","группа 1 — к подвыражению, начинающемуся с “(“ и заканчивающемуся “)” (и так далее);","при повторении группы в качестве «группы 1» берется последнее совпадение."],"style":"unordered"}},{"type":"paragraph","data":{"text":"В примерах некоторые элементы подчеркнуты. Это не баг, это фича, помогающая увидеть, какой элемент в какой список групп попал. Также используется новая функция — FindAllStringSubmatch — возвращающая срез последовательных непересекающихся подсовпадений (совпадений скобочных групп). Вторым параметром в данной функции является ограничение количества найденных подсовпадений (найдется всё, если использовать -1)."}},{"type":"paragraph","data":{"text":"Тема групп совсем не проста, поэтому пробуйте разное, ломайте, дебажьте."}},{"type":"code","data":{"code":"re, _ := regexp.Compile(`.(\\d+)`)\r\nres := re.FindAllStringSubmatch(\"Funny1 2020 ye12ar\", -1)\r\nfmt.Println(res) // [[y1 1] [ 2020 2020] [e12 12]]","language":"go lazy-code"}},{"type":"paragraph","data":{"text":"Ищем все подсовпадения с выражением «любой символ, одна и более цифра», находим три вхождения, в каждом из которых есть группа 0 – всё вхождение целиком – и группа 1 – часть с «одна и более цифра»."}},{"type":"code","data":{"code":"re, _ := regexp.Compile(`(\\d{4})-(\\d{2})-(\\d{2})`)\r\nres := re.FindAllStringSubmatch(\"Now is 2021-01-14\", -1)\r\nfmt.Println(res) // [[2021-01-14 2021 01 14]]","language":"go lazy-code"}},{"type":"paragraph","data":{"text":"Выделяем год, месяц и день в отдельные группы, ищем (4 цифры), тире, (2 цифры), тире, (2 цифры). Получаем одно подсовпадение, где группа 0 — вся дата, группа 1 — год, группа 2 — месяц, группа 3 — день."}},{"type":"paragraph","data":{"text":"Парсинг дат в разных форматах может быть использован в кейсах, когда нам необходимо, например, сделать предположение о возможном содержимом столбцов с данными из стороннего датафрейма и выделить колонки с. временными метками. Реализация без регулярных выражений будет достаточно неудобна."}},{"type":"code","data":{"code":"re, _ := regexp.Compile(`.*?(([a-zA-Z\\-0-9]+)\\\\.[a-zA-Z]{2,})`)\r\nres := re.FindAllStringSubmatch(\"version: v2-v3\\\\\\\\Go\", -1)\r\nfmt.Println(res) // [[version: v2-v3\\\\Go v2-v3\\\\Go v2-v3]]","language":"go lazy-code"}},{"type":"paragraph","data":{"text":"Как ни странно, в группе может быть внутренняя подгруппа (а в ней ещё одна…и ещё…). Здесь мы ищем ноль и более (лучше меньше) любых символов, одно и более повторение символа из перечня [a-zA-Z\\-0-9], слэш, любой символ, 2 и более повторения символов из перечня [a-zA-Z]. В итоге находим одно вхождение, где группа 0 – все выражение, группа 1, как внешняя, целиком соответствует части «одно и более повторение символа из перечня [a-zA-Z\\-0-9], слэш, любой символ, 2 и более повторения символов из перечня [a-zA-Z]», а группа 2 – части «одно и более повторение символа из перечня [a-zA-Z\\-0-9]»."}},{"type":"paragraph","data":{"text":"Вспоминается мем (в нём, кстати, есть мааленькая опечатка :), кто отыщет?):"}},{"type":"image","data":{"file":{"id":168129,"url":"https://media.tproger.ru/uploads/2021/07/ris1.jpg"},"alt":"","title":"","caption":"","stretched":false,"withBackground":false,"withBorder":false,"width":1057,"height":1155,"optimizedFile":{"original":"https://media.tproger.ru/uploads/2021/07/ris1.jpg","alt":"Путешествие в golang regexp 8","dimensions":{"width":1057,"height":1155},"additionalSizes":{"srcSet":[{"url":"https://tproger.ru/signed_image/kNO7oznodvveSk4BNrVaP1gMxf3INJqBNH_D96QL5nM/rs:fill:766:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAyMS8wNy9yaXMxLmpwZw=","dpr":1,"width":766},{"url":"https://tproger.ru/signed_image/Ci2yd-2pwbtsHb6RHr0kRONaFmUHIaSoM4ksS0O5ONc/rs:fill:1532:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAyMS8wNy9yaXMxLmpwZw=","dpr":1,"width":1532},{"url":"https://tproger.ru/signed_image/PZBOt9BcB5TsJFDNImkHA5bC203RBQ9HbZoFGo9kGdA/rs:fill:686:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAyMS8wNy9yaXMxLmpwZw=","dpr":1,"width":686},{"url":"https://tproger.ru/signed_image/gldcvkHGnAnqb75xj_QibK6Fo_mRDfRETTUaTAsKLU4/rs:fill:1372:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAyMS8wNy9yaXMxLmpwZw=","dpr":1,"width":1372},{"url":"https://tproger.ru/signed_image/qXQfwnWLDasvUSPUvTniRIhDbYV-6GmB6nbAmiGgGDo/rs:fill:636:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAyMS8wNy9yaXMxLmpwZw=","dpr":1,"width":636},{"url":"https://tproger.ru/signed_image/ahWHs36dvekb7MDU_H5qJQSfC2_UNc9vtn-qhzdqH7M/rs:fill:1272:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAyMS8wNy9yaXMxLmpwZw=","dpr":1,"width":1272},{"url":"https://tproger.ru/signed_image/iGLaew8iAE5fqLm0IVf8eG2DEZJ0_fK9e5_7-5ttOhk/rs:fill:466:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAyMS8wNy9yaXMxLmpwZw=","dpr":1,"width":466},{"url":"https://tproger.ru/signed_image/bbhffYox01U2vhRfpXPnMfWesjOmyy2SHeoQ5av7lmw/rs:fill:932:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAyMS8wNy9yaXMxLmpwZw=","dpr":1,"width":932}],"sizes":[{"media":"(min-width: 1441px)","size":"766px"},{"media":"(min-width: 1281px)","size":"686px"},{"media":"(min-width: 1281px)","size":"766px"},{"media":"(min-width: 961px)","size":"766px"},{"media":"(min-width: 671px)","size":"636px"},{"media":"(min-width: 500px)","size":"466px"}]}}}},{"type":"paragraph","data":{"text":"С группами, как и с математическим анализом, нужно сесть, поплакать, хорошо разобраться один раз и работать на автомате в дальнейшем…"}},{"type":"header3","data":{"level":3,"text":"Именованные и необязательные группы"}},{"type":"image","data":{"file":{"id":168134,"url":"https://media.tproger.ru/uploads/2021/07/Snimok8.jpg"},"alt":"","title":"","caption":"","stretched":false,"withBackground":false,"withBorder":false,"width":640,"height":190,"optimizedFile":{"original":"https://media.tproger.ru/uploads/2021/07/Snimok8.jpg","alt":"Путешествие в golang regexp 9","dimensions":{"width":640,"height":190},"additionalSizes":{"srcSet":[{"url":"https://tproger.ru/signed_image/ltt12AtEGYGnuWLuQ68h1IeFjwIrrpAhDwdo-aAJ8_A/rs:fill:640:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAyMS8wNy9Tbmltb2s4LmpwZw=","dpr":1,"width":640},{"url":"https://tproger.ru/signed_image/8owy12u2gJV-OrnaG-AMrboJhW69jXiKkPRtW8koVSs/rs:fill:1280:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAyMS8wNy9Tbmltb2s4LmpwZw=","dpr":1,"width":1280},{"url":"https://tproger.ru/signed_image/ltt12AtEGYGnuWLuQ68h1IeFjwIrrpAhDwdo-aAJ8_A/rs:fill:640:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAyMS8wNy9Tbmltb2s4LmpwZw=","dpr":1,"width":640},{"url":"https://tproger.ru/signed_image/8owy12u2gJV-OrnaG-AMrboJhW69jXiKkPRtW8koVSs/rs:fill:1280:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAyMS8wNy9Tbmltb2s4LmpwZw=","dpr":1,"width":1280},{"url":"https://tproger.ru/signed_image/ALM1w2eLT-CH2_NTbaf1KOy7Zg3Fo_Cj70Z3bYuc748/rs:fill:636:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAyMS8wNy9Tbmltb2s4LmpwZw=","dpr":1,"width":636},{"url":"https://tproger.ru/signed_image/tkAG1q4f0d7i4hWE_DQkcyXV5AoemhuDTGRLwatWJ1Q/rs:fill:1272:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAyMS8wNy9Tbmltb2s4LmpwZw=","dpr":1,"width":1272},{"url":"https://tproger.ru/signed_image/zfkGvx_UidWTqtmc2shZ7dFnlaqwyCFAGaRF8GvofHY/rs:fill:466:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAyMS8wNy9Tbmltb2s4LmpwZw=","dpr":1,"width":466},{"url":"https://tproger.ru/signed_image/eQtdRNcDsBDe-1qKLFCAyo_LlNWuoknoxugRAK1sOEk/rs:fill:932:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAyMS8wNy9Tbmltb2s4LmpwZw=","dpr":1,"width":932}],"sizes":[{"media":"(min-width: 1441px)","size":"640px"},{"media":"(min-width: 1281px)","size":"640px"},{"media":"(min-width: 1281px)","size":"640px"},{"media":"(min-width: 961px)","size":"640px"},{"media":"(min-width: 671px)","size":"636px"},{"media":"(min-width: 500px)","size":"466px"}]}}}},{"type":"paragraph","data":{"text":"Еще один факт о регулярных выражениях в Golang:"}},{"type":"list","data":{"items":["обратных ссылок тут нет (!) (запоминание встретившейся группы для повторного использования в том же выражении)."],"style":"unordered"}},{"type":"paragraph","data":{"text":"Иногда этот факт вызывает головную боль."}},{"type":"paragraph","data":{"text":"В примерах используется новая вспомогательная функция — SubexpNames — позволяющая получить доступ к списку разделённых по названию групп подсовпадений."}},{"type":"code","data":{"code":"re, _ := regexp.Compile(`(?P\\d{4})-(?P\\d{2})-(?P\\d{2})`)\r\nres := re.FindAllStringSubmatch(\"trash trash \\n \\t 2021-01-14 ! \r\ntrash again\", -1)\r\nfor _, v := range res {\r\n\tfor kk, vv := range re.SubexpNames() {\r\n\t\tif vv==\"Year\" {fmt.Printf(\"year: %s, \", v[kk])}\r\n\t\tif vv==\"Month\" {fmt.Printf(\"month: %s, \", v[kk])}\r\n\t\tif vv==\"Day\" {fmt.Printf(\"day: %s\\n\", v[kk])}\r\n\t}\r\n}\r\n// year: 2021, month: 01, day: 14","language":"go lazy-code"}},{"type":"paragraph","data":{"text":"Пытаемся выловить из мусорного текста дату, разделив её на год, месяц, день. В группу Year попадают первые 4 цифры до тире, группу Month — 2 цифры до следующего тире, Day — последние 2 цифры. Доступ к разделенным по названиям групп подсовпадениям получаем при помощи прохождения по re.SubexpNames()"}},{"type":"code","data":{"code":"re, _ := regexp.Compile(`(?:[Gg]o)([pP]y)`)\r\nres := re.FindAllStringSubmatch(\"Gopy goPy\", -1)\r\nfmt.Println(res) // [[Gopy py] [goPy Py]]","language":"go lazy-code"}},{"type":"paragraph","data":{"text":"Ищем go либо Go (группа, которая не попадает в список подсовпадений благодаря ?: после открывающей скобки группы), py либо Py — находим два подсовпадения, где группа 0 — вхождение целиком, группа 1 – вторая группа
(которая «py либо Py»)."}},{"type":"header3","data":{"level":3,"text":"Другие функции для работы с регулярными выражениями"}},{"type":"paragraph","data":{"text":"Формула функций работы с регулярными выражениями:"}},{"type":"code","data":{"code":"Find(All)?(String)?(Submatch)?(Index)?","language":"clike lazy-code"}},{"type":"image","data":{"file":{"id":168188,"url":"https://media.tproger.ru/uploads/2021/07/Snimok9.jpg"},"alt":"","title":"","caption":"","stretched":false,"withBackground":false,"withBorder":false,"width":639,"height":195,"optimizedFile":{"original":"https://media.tproger.ru/uploads/2021/07/Snimok9.jpg","alt":"Путешествие в golang regexp 10","dimensions":{"width":639,"height":195},"additionalSizes":{"srcSet":[{"url":"https://tproger.ru/signed_image/a85AxaxsCzDkyo_BM-y4UQ4lWHVDt42_zvH_2W4C5mw/rs:fill:639:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAyMS8wNy9Tbmltb2s5LmpwZw=","dpr":1,"width":639},{"url":"https://tproger.ru/signed_image/4uDa7V3P2TJNzo90Y7sqTUSbi4u5-N2ZPQJDDTF6jYk/rs:fill:1278:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAyMS8wNy9Tbmltb2s5LmpwZw=","dpr":1,"width":1278},{"url":"https://tproger.ru/signed_image/a85AxaxsCzDkyo_BM-y4UQ4lWHVDt42_zvH_2W4C5mw/rs:fill:639:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAyMS8wNy9Tbmltb2s5LmpwZw=","dpr":1,"width":639},{"url":"https://tproger.ru/signed_image/4uDa7V3P2TJNzo90Y7sqTUSbi4u5-N2ZPQJDDTF6jYk/rs:fill:1278:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAyMS8wNy9Tbmltb2s5LmpwZw=","dpr":1,"width":1278},{"url":"https://tproger.ru/signed_image/TEroIzpv9zmGDR9baKO05wZh_UCJGTakxWSkR_8hCSE/rs:fill:636:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAyMS8wNy9Tbmltb2s5LmpwZw=","dpr":1,"width":636},{"url":"https://tproger.ru/signed_image/EjaWNyp43sbdvZ-IUxkp26aYvCsbZbS5QDPFdGzj5z8/rs:fill:1272:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAyMS8wNy9Tbmltb2s5LmpwZw=","dpr":1,"width":1272},{"url":"https://tproger.ru/signed_image/WR24gvNeHDdxhcYGIV9ESkHlk81W7CgkTCADu5gQN7s/rs:fill:466:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAyMS8wNy9Tbmltb2s5LmpwZw=","dpr":1,"width":466},{"url":"https://tproger.ru/signed_image/j281nqSUDw7kYWcxD6MKF7d39QHDmV4TSRSo-oFt1tQ/rs:fill:932:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAyMS8wNy9Tbmltb2s5LmpwZw=","dpr":1,"width":932}],"sizes":[{"media":"(min-width: 1441px)","size":"639px"},{"media":"(min-width: 1281px)","size":"639px"},{"media":"(min-width: 1281px)","size":"639px"},{"media":"(min-width: 961px)","size":"639px"},{"media":"(min-width: 671px)","size":"636px"},{"media":"(min-width: 500px)","size":"466px"}]}}}},{"type":"paragraph","data":{"text":"Также рассмотрим несколько иных функций на примерах."}},{"type":"code","data":{"code":"Split (сплитим текст на части по регулярному выражению-разделителю):\r\nre := regexp.MustCompile(`[A-Z\\d_]+`)\r\nres := re.Split(\"then_theyKgo325236somewhere\", -1)\r\nfmt.Println(res) // [then they go somewhere]","language":"go lazy-code"}},{"type":"code","data":{"code":"Replace (чистим тот же самый текст, заменяя соответствия регулярке пробелами):\r\nre := regexp.MustCompile(`[A-Z\\d_]+`)\r\nres := re.ReplaceAllString(\"then_theyKgo325236somewhere\", \" \")\r\nfmt.Println(res) // then they go somewhere","language":"go lazy-code"}},{"type":"code","data":{"code":"Replace 2 (меняем местами соответствующие группам слова):\r\nre := regexp.MustCompile(`(?P[a-zA-Z]+) (?P[a-zA-Z]+)`)\r\nreversed := fmt.Sprintf(\"${%s} ${%s}\", re.SubexpNames()[2], \r\nre.SubexpNames()[1])\r\nfmt.Println(re.ReplaceAllString(\"doctor Strange\", reversed)) // \r\nStrange doctor","language":"go lazy-code"}},{"type":"paragraph","data":{"text":"Дальше будет сложно. Слабонервным рекомендуется закрыть статью, отойти от экранов и уехать жить в Лондон (почему бы и нет)."}},{"type":"header3","data":{"level":3,"text":"Большие примеры с кейсами применения регулярных выражений"}},{"type":"header4","data":{"level":4,"text":"Валидация логина:"}},{"type":"code","data":{"code":"loginPattern := `^[a-zA-Z]{1}[\\w@\\.]{5,}$`","language":"go lazy-code"}},{"type":"code","data":{"code":"matched, _ = regexp.MatchString(loginPattern, \"1strange_Gopher.2020\")\r\nfmt.Println(matched) // false, логин не должен начинаться с цифры","language":"go lazy-code"}},{"type":"header4","data":{"level":4,"text":"Фильтрация трафика syslog (привет работающим с logstash и его фильтрами):"}},{"type":"code","data":{"code":"sysPattern := `(?:id=(?P\\d+?) )(?:id2=(?P\\w+) )?(?:nD=(?P\\d{1,5}))`","language":"go lazy-code"}},{"type":"code","data":{"code":"re, _ := regexp.Compile(sysPattern)\r\nres := re.FindAllStringSubmatch(\"id=56 nD=9\", -1)\r\nfmt.Println(res) // [[id=56 nD=9 56 9]] (группа id2 – не обязательна, поэтому текст соответствует регулярному выражению, а группа id2 просто не заполняется)","language":"go lazy-code"}},{"type":"header4","data":{"level":4,"text":"Парсинг имен таблиц и баз данных, к которым идет обращение, из SELECT SQL-запроса:"}},{"type":"code","data":{"code":"selectPattern := \r\n`(select|SELECT)[\\s]+[^\\r]*?[\\s]+(from|FROM)[\\s]+(?P[^\\s()]+)[\\s]*`","language":"go lazy-code"}},{"type":"code","data":{"code":"query := `SELECT * FROM testdb.test WHERE id=(SELECT id FROM testdb.test2 \r\nWHERE score > 1) AND num=(SELECT max(fact) FROM testdb.test3)`","language":"go lazy-code"}},{"type":"code","data":{"code":"res := make([]string, 0)\r\nreger, _ := regexp.Compile(selectPattern)\r\nallSel := reger.FindAllStringSubmatch(query, -1)\r\nfor _, match := range allSel {\r\n\tfor ind, subName := range reger.SubexpNames() {\r\n\t\tif subName == \"TAB\" {\r\n\t\t\tres = append(res, match[ind])\r\n\t\t}\r\n\t}\r\n}\r\nfmt.Println(strings.Join(res, \", \")) // testdb.test, testdb.test2,\r\ntestdb.test3","language":"go lazy-code"}},{"type":"header3","data":{"level":3,"text":"Маленькое заключение"}},{"type":"paragraph","data":{"text":"Регулярные выражения — достаточно полезная штука при анализе текста, парсинге потокаданных, когда необходимо вытащить оттуда нечто действительно важное…ну и вообще для всякого рода магии ?"}},{"type":"paragraph","data":{"text":"Разбирайтесь, не бойтесь экспериментировать и развлекайтесь!"}}]}

Ошибка в настройках сайта