<meta name="description" content="包含实用示例和技巧的综合指南。附赠免费工具。"> <link rel="canonical" href="https://run-dev.com/zh/blog/regex-beginners-guide.html"> <meta property="og:title" content="Regular Expressions: A Beginner's Guide"> <meta property="og:description" content="Regular Expressions: A Beginner's Guide. Free guide with examples."> <meta property="og:url" content="https://run-dev.com/zh/blog/regex-beginners-guide.html"> <meta property="og:type" content="article"> <meta name="twitter:card" content="summary_large_image"> <link rel="stylesheet" href="/css/style.css?v=20260327c"> <script src="/js/theme.js"></script> <script async src="https://pagead2.googlesyndication.com/pagead/js/adsbygoogle.js?client=ca-pub-6478776854131333" crossorigin="anonymous"></script> <link rel="icon" type="image/svg+xml" href="/favicon.svg"> <script type="application/ld+json">{"@context": "https://schema.org", "@type": "BlogPosting", "headline": "Regex Beginners Guide", "datePublished": "2026-03-16", "dateModified":"2026-03-31", "author": {"@type": "Organization", "name": "RunDev"}, "publisher": {"@type": "Organization", "name": "RunDev"}, "description": "Regular Expressions: A Beginner's Guide. Comprehensive guide with practical examples and tips. Free tools included.", "mainEntityOfPage": {"@type": "WebPage", "@id": "https://run-dev.com/blog/regex-beginners-guide.html"}}</script> <script type="application/ld+json">{"@context": "https://schema.org", "@type": "BreadcrumbList", "itemListElement": [{"@type": "ListItem", "position": 1, "name": "Home", "item": "https://run-dev.com/"}, {"@type": "ListItem", "position": 2, "name": "Blog", "item": "https://run-dev.com/blog/"}, {"@type": "ListItem", "position": 3, "name": "Regex Beginners Guide", "item": "https://run-dev.com/blog/regex-beginners-guide.html"}]}</script> <link rel="alternate" hreflang="zh" href="https://run-dev.com/zh/blog/regex-beginners-guide.html"> <link rel="alternate" hreflang="en" href="https://run-dev.com/blog/regex-beginners-guide.html"> <script src="https://pl29160645.profitablecpmratenetwork.com/29/f6/7f/29f67ff8bf498458f92969a51a2f1bcf.js"></script> <script async src="https://www.googletagmanager.com/gtag/js?id=G-CZ7GQC3DKR"></script><script>window.dataLayer=window.dataLayer||[];function gtag(){dataLayer.push(arguments);}gtag("js",new Date());gtag("config","G-CZ7GQC3DKR",{"linker":{"domains":["conv-kit.com,go-calc.com,gen-kit.com,run-dev.com,seo-io.com,txt-tool.com,img-kit.com,the-pdf.com,dl-kit.com,nettool1.com"]}});</script></head> <body> <header class="site-header"> <div class="container header-inner"> <a href="/" class="logo"> <svg viewBox="0 0 28 28" width="28" height="28" fill="none" xmlns="http://www.w3.org/2000/svg"> <rect width="28" height="28" rx="6" fill="#38bdf8"/> <path d="M8 6l-6 6 6 6" stroke="#fff" stroke-width="2" stroke-linecap="round"/><path d="M20 6l6 6-6 6" stroke="#fff" stroke-width="2" stroke-linecap="round"/><path d="M15 4l-2 20" stroke="#fff" stroke-width="2" stroke-linecap="round"/> </svg> Run<span class="logo-accent">Dev</span> </a> <button class="mobile-menu-btn" aria-label="Toggle menu" onclick="document.querySelector('.nav-links').classList.toggle('open')">☰</button> <nav class="nav-links" aria-label="Main navigation"> <a href="/" class="active">Home</a> <a href="/alltools/">Tools</a> <a href="/blog/">Blog</a> <a href="/about.html">About</a> </nav> <div class="header-actions"> <div class="lang-dropdown"> <button class="lang-btn" onclick="this.nextElementSibling.classList.toggle('show')" aria-label="Language"> <span>🇺🇸</span> EN <svg width="12" height="12" viewBox="0 0 12 12" fill="none"><path d="M3 5l3 3 3-3" stroke="currentColor" stroke-width="1.5" stroke-linecap="round"/></svg> </button> <div class="lang-menu" id="langMenu"> <a href="/">🇺🇸 English</a> <a href="/es/">🇪🇸 Español</a> <a href="/fr/">🇫🇷 Français</a> <a href="/de/">🇩🇪 Deutsch</a> <a href="/ja/">🇯🇵 日本語</a> <a href="/pt/">🇧🇷 Português</a> <a href="/zh/">🇨🇳 中文</a> <a href="/ko/">🇰🇷 한국어</a> </div> </div> <button class="theme-toggle" id="themeToggle" onclick="toggleTheme()" title="Toggle theme"> <svg width="18" height="18" viewBox="0 0 24 24" fill="none" stroke="currentColor" stroke-width="2" stroke-linecap="round"><circle cx="12" cy="12" r="5"/><path d="M12 1v2M12 21v2M4.22 4.22l1.42 1.42M18.36 18.36l1.42 1.42M1 12h2M21 12h2M4.22 19.78l1.42-1.42M18.36 5.64l1.42-1.42"/></svg> </button> </div> </div> </header> <nav class="breadcrumb" aria-label="Breadcrumb"><div class="container"><a href="/">RunDev</a><span class="sep">/</span><a href="/blog/">Blog</a><span class="sep">/</span><span>Regular Expressions: A Beginner's Guide</span></div></nav> <main id="main-content"> <article class="container" style="max-width:800px;margin:2rem auto;padding:0 1rem"><h1>正则表达式:初学者指南</h1> <p class="text-muted" style="margin-bottom:1.5rem"><time datetime="2026-03-31">2026年3月31日</time> · 12分钟阅读</p> <details open style="background:var(--bg-secondary);border:1px solid var(--border);border-radius:8px;padding:1.25rem;margin:1.5rem 0"> <summary style="cursor:pointer;font-weight:600;margin-bottom:0.75rem">📑 目录</summary> <ul style="margin:0;padding-left:1.5rem"> <li><a href="#what-are-regular-expressions">什么是正则表达式?</a></li> <li><a href="#basic-building-blocks">基本构建块</a></li> <li><a href="#quantifiers-explained">量词详解</a></li> <li><a href="#character-classes">字符类和快捷方式</a></li> <li><a href="#anchors-boundaries">锚点和边界</a></li> <li><a href="#groups-capturing">分组和捕获</a></li> <li><a href="#practical-examples">实际示例</a></li> <li><a href="#advanced-techniques">高级技巧</a></li> <li><a href="#common-pitfalls">常见陷阱及避免方法</a></li> <li><a href="#testing-debugging">测试和调试正则表达式</a></li> <li><a href="#performance-considerations">性能考虑</a></li> <li><a href="#faq">常见问题</a></li> </ul> </details> <p>正则表达式(regex)是开发者工具库中最强大的工具之一。它们起初可能看起来令人生畏,但一旦你理解了基础知识,它们就会成为文本处理、验证和数据提取不可或缺的工具。</p> <p>无论你是在验证用户输入、解析日志文件还是转换数据,正则表达式都提供了一种简洁灵活的方式来处理文本模式。本指南将带你从完全的初学者成长为自信的正则表达式用户。</p> <h2 id="what-are-regular-expressions">什么是正则表达式?</h2> <p>正则表达式是定义搜索模式的字符序列。可以把它看作是描述文本模式的迷你语言——你可以搜索"任何电子邮件地址"或"任何电话号码"等模式,而不是搜索精确的字符串。</p> <p>正则表达式几乎在每种编程语言和文本编辑器中都有使用。它们在JavaScript、Python、Java、PHP、Ruby、Go和无数其他语言中都得到支持。甚至像<code>grep</code>、<code>sed</code>和<code>awk</code>这样的命令行工具也严重依赖正则表达式。</p> <p>正则表达式的美妙之处在于,一旦你学会了语法,就可以在不同的工具和语言中应用它。虽然正则表达式的不同"风格"(PCRE、JavaScript、Python等)之间存在细微差异,但核心概念保持不变。</p> <div style="background:var(--bg-secondary);border:1px solid var(--border);border-radius:8px;padding:1.25rem;margin:1.5rem 0"><p style="margin:0"><strong>专业提示:</strong> 从简单的模式开始,逐步增加复杂性。不要试图在第一次尝试时就写出完美的正则表达式——在测试时迭代和改进。</p></div> <h2 id="basic-building-blocks">基本构建块</h2> <p>每个正则表达式模式都是由基本组件构建的。在转向更复杂的模式之前,理解这些构建块至关重要。</p> <h3>字面字符</h3> <p>最简单的正则表达式就是纯文本。模式<code>cat</code>匹配字符串中任何位置的确切文本"cat"。大多数字母数字字符按字面意思匹配自己。</p> <p>但是,某些字符在正则表达式中具有特殊含义,需要用反斜杠转义:<code>. ^ $ * + ? { } [ ] \ | ( )</code></p> <p>要匹配字面句点,你需要写<code>\.</code>而不是只写<code>.</code></p> <h3>点元字符</h3> <p>点(<code>.</code>)是一个通配符,匹配除换行符外的任何单个字符。模式<code>c.t</code>匹配"cat"、"cot"、"cut"、"c9t",甚至"c@t"。</p> <p>这使得点非常强大,但如果使用不当也可能很危险。我们稍后会介绍如何使其更具体。</p> <h3>字符类</h3> <p>方括号创建一个字符类,匹配括号内的任何单个字符:</p> <ul> <li><code>[aeiou]</code> 匹配任何元音</li> <li><code>[0-9]</code> 匹配任何数字</li> <li><code>[a-zA-Z]</code> 匹配任何字母(大写或小写)</li> <li><code>[a-z0-9]</code> 匹配任何小写字母或数字</li> </ul> <p>你还可以用插入符号否定字符类:<code>[^0-9]</code>匹配任何不是数字的字符。</p> <h2 id="quantifiers-explained">量词详解</h2> <p>量词指定模式应该匹配多少次。它们放在你想要重复的元素之后。</p> <table style="width:100%;border-collapse:collapse;margin:1.5rem 0"> <thead> <tr style="border-bottom:2px solid var(--border)"> <th style="padding:0.75rem;text-align:left">量词</th> <th style="padding:0.75rem;text-align:left">含义</th> <th style="padding:0.75rem;text-align:left">示例</th> </tr> </thead> <tbody> <tr style="border-bottom:1px solid var(--border)"> <td style="padding:0.75rem"><code>*</code></td> <td style="padding:0.75rem">0次或多次</td> <td style="padding:0.75rem"><code>ab*c</code> 匹配"ac"、"abc"、"abbc"</td> </tr> <tr style="border-bottom:1px solid var(--border)"> <td style="padding:0.75rem"><code>+</code></td> <td style="padding:0.75rem">1次或多次</td> <td style="padding:0.75rem"><code>ab+c</code> 匹配"abc"、"abbc"但不匹配"ac"</td> </tr> <tr style="border-bottom:1px solid var(--border)"> <td style="padding:0.75rem"><code>?</code></td> <td style="padding:0.75rem">0次或1次(可选)</td> <td style="padding:0.75rem"><code>colou?r</code> 匹配"color"和"colour"</td> </tr> <tr style="border-bottom:1px solid var(--border)"> <td style="padding:0.75rem"><code>{n}</code></td> <td style="padding:0.75rem">恰好n次</td> <td style="padding:0.75rem"><code>\d{3}</code> 恰好匹配3个数字</td> </tr> <tr style="border-bottom:1px solid var(--border)"> <td style="padding:0.75rem"><code>{n,}</code></td> <td style="padding:0.75rem">n次或更多次</td> <td style="padding:0.75rem"><code>\d{2,}</code> 匹配2个或更多数字</td> </tr> <tr style="border-bottom:1px solid var(--border)"> <td style="padding:0.75rem"><code>{n,m}</code></td> <td style="padding:0.75rem">n到m次之间</td> <td style="padding:0.75rem"><code>\d{2,4}</code> 匹配2、3或4个数字</td> </tr> </tbody> </table> <h3>贪婪匹配与懒惰匹配</h3> <p>默认情况下,量词是贪婪的——它们尽可能多地匹配文本。模式<code>.*</code>会消耗它能消耗的所有内容。</p> <p>考虑匹配HTML标签:<code><.+></code>应用于<code><b>bold</b></code>将匹配整个字符串,而不仅仅是<code><b></code>。</p> <p>要使量词变为懒惰(尽可能少地匹配),添加一个问号:<code><.+?></code>现在将分别匹配<code><b></code>和<code></b></code>。</p> <div style="background:var(--bg-secondary);border:1px solid var(--border);border-radius:8px;padding:1.25rem;margin:1.5rem 0"><p style="margin:0"><strong>快速提示:</strong> 如有疑问,使用懒惰量词。它们更可预测,不太可能导致意外匹配。</p></div> <h2 id="character-classes">字符类和快捷方式</h2> <p>重复写<code>[0-9]</code>会变得乏味。正则表达式为常见模式提供了简写字符类。</p> <table style="width:100%;border-collapse:collapse;margin:1.5rem 0"> <thead> <tr style="border-bottom:2px solid var(--border)"> <th style="padding:0.75rem;text-align:left">简写</th> <th style="padding:0.75rem;text-align:left">等效</th> <th style="padding:0.75rem;text-align:left">描述</th> </tr> </thead> <tbody> <tr style="border-bottom:1px solid var(--border)"> <td style="padding:0.75rem"><code>\d</code></td> <td style="padding:0.75rem"><code>[0-9]</code></td> <td style="padding:0.75rem">任何数字</td> </tr> <tr style="border-bottom:1px solid var(--border)"> <td style="padding:0.75rem"><code>\D</code></td> <td style="padding:0.75rem"><code>[^0-9]</code></td> <td style="padding:0.75rem">任何非数字</td> </tr> <tr style="border-bottom:1px solid var(--border)"> <td style="padding:0.75rem"><code>\w</code></td> <td style="padding:0.75rem"><code>[a-zA-Z0-9_]</code></td> <td style="padding:0.75rem">任何单词字符</td> </tr> <tr style="border-bottom:1px solid var(--border)"> <td style="padding:0.75rem"><code>\W</code></td> <td style="padding:0.75rem"><code>[^a-zA-Z0-9_]</code></td> <td style="padding:0.75rem">任何非单词字符</td> </tr> <tr style="border-bottom:1px solid var(--border)"> <td style="padding:0.75rem"><code>\s</code></td> <td style="padding:0.75rem"><code>[ \t\r\n\f]</code></td> <td style="padding:0.75rem">任何空白字符</td> </tr> <tr style="border-bottom:1px solid var(--border)"> <td style="padding:0.75rem"><code>\S</code></td> <td style="padding:0.75rem"><code>[^ \t\r\n\f]</code></td> <td style="padding:0.75rem">任何非空白字符</td> </tr> </tbody> </table> <p>注意这个模式:大写版本是其小写对应版本的否定。这使得正则表达式更易读和简洁。</p> <h3>使用快捷方式的实际示例</h3> <ul> <li><code>\d{3}-\d{4}</code> 匹配像"555-1234"这样的电话号码</li> <li><code>\w+@\w+\.\w+</code> 匹配简单的电子邮件地址</li> <li><code>\s+</code> 匹配一个或多个空白字符</li> <li><code>\d{1,3}\.\d{1,3}\.\d{1,3}\.\d{1,3}</code> 匹配IP地址(虽然不完美)</li> </ul> <h2 id="anchors-boundaries">锚点和边界</h2> <p>锚点不匹配字符——它们匹配文本中的位置。它们对于精确的模式匹配至关重要。</p> <h3>行锚点</h3> <ul> <li><code>^</code> 匹配行的开始</li> <li><code>$</code> 匹配行的结束</li> </ul> <p>模式<code>^Hello</code>只匹配行开头的"Hello"。类似地,<code>world$</code>只匹配行末尾的"world"。</p> <p>要精确匹配整行,同时使用两者:<code>^Hello world$</code>只匹配恰好包含"Hello world"且前后没有其他内容的行。</p> <h3>单词边界</h3> <p><code>\b</code>锚点匹配单词边界——单词字符(<code>\w</code>)和非单词字符之间的位置。</p> <p>这对于匹配整个单词非常有用。模式<code>\bcat\b</code>匹配"cat"但不匹配"category"或"scat"。</p> <p>没有单词边界,<code>cat</code>会匹配所有三个。单词边界使你的模式更精确而不增加复杂性。</p> <div style="background:var(--bg-secondary);border:1px solid var(--border);border-radius:8px;padding:1.25rem;margin:1.5rem 0"><p style="margin:0"><strong>专业提示:</strong> 搜索整个单词时始终使用单词边界。它可以防止错误匹配并使你的正则表达式更可靠。</p></div> <h2 id="groups-capturing">分组和捕获</h2> <p>括号在正则表达式中有两个用途:分组和捕获。一旦你理解了它们的工作原理,它们就是最强大的功能之一。</p> <h3>用于量词的分组</h3> <p>括号允许你将量词应用于多个字符。模式<code>(ha)+</code>匹配"ha"、"haha"、"hahaha"等。</p> <p>没有括号,<code>ha+</code>会匹配"ha"、"haa"、"haaa"——量词只应用于前面的字符。</p> <h3>捕获组</h3> <p>组还会捕获匹配的文本以供以后使用。考虑这个电话号码模式:<code>(\d{3})-(\d{3})-(\d{4})</code></p> <p>这创建了三个捕获组:区号、前缀和线路号码。在大多数语言中,你可以访问这些捕获:</p> <ul> <li>JavaScript: <code>match[1]</code>、<code>match[2]</code>、<code>match[3]</code></li> <li>Python: <code>match.group(1)</code>、<code>match.group(2)</code>、<code>match.group(3)</code></li> <li>在替换中: <code>$1</code>、<code>$2</code>、<code>$3</code> 或 <code>\1</code>、<code>\2</code>、<code>\3</code></li> </ul> <h3>非捕获组</h3> <p>有时你想要分组而不捕获。使用<code>(?:...)</code>表示非捕获组:<code>(?:https?://)?www\.example\.com</code></p> <p>这会对协议进行分组但不创建捕获组,这可以提高性能并简化你的代码。</p> <h3>命名捕获组</h3> <p>你可以为组命名以提高清晰度,而不是使用编号组:<code>(?<area>\d{3})-(?<prefix>\d{3})-(?<line>\d{4})</code></p> <p>在Python中使用<code>match.group('area')</code>或在JavaScript中使用<code>match.groups.area</code>访问命名组。这使你的代码具有自我说明性。</p> <h2 id="practical-examples">实际示例</h2> <p>让我们将所学知识应用于实际场景。这些模式是起点——你通常需要根据具体要求进行调整。</p> <h3>电子邮件验证</h3> <p>一个简单的电子邮件模式:<code>[\w.+-]+@[\w.-]+\.[a-zA-Z]{2,}</code></p> <p>这匹配大多数常见的电子邮件格式,但不符合RFC标准。对于生产使用,考虑使用专用的电子邮件验证库——电子邮件正则表达式可能会变得极其复杂。</p> <h3>URL匹配</h3> <p>匹配HTTP和HTTPS URL:<code>https?://[\w.-]+(?:\.[\w.-]+)+(?:/[\w./?&=%-]*)?</code></p> <p>这处理域名、路径和查询字符串。<code>s?</code>使'https'中的's'可选。</p> <h3>电话号码</h3> <p>具有灵活格式的美国电话号码:<code>\(?\d{3}\)?[\s.-]?\d{3}[\s.-]?\d{4}</code></p> <p>这匹配如下格式:</p> <ul> <li>(555) 123-4567</li> <li>555-123-4567</li> <li>555.123.4567</li> <li>5551234567</li> </ul> <h3>日期格式</h3> <p>ISO日期格式(YYYY-MM-DD):<code>\d{4}-(?:0[1-9]|1[0-2])-(?:0[1-9]|[12]\d|3[01])</code></p> <p>这确保月份为01-12,日期为01-31。它比<code>\d{4}-\d{2}-\d{2}</code>更准确,后者会接受像2024-99-99这样的无效日期。</p> <h3>IP地址</h3> <p>IPv4地址:<code>\b(?:(?:25[0-5]|2[0-4]\d|[01]?\d\d?)\.){3}(?:25[0-5]|2[0-4]\d|[01]?\d\d?)\b</code></p> <p>这验证每个八位字节在0-255之间,防止匹配像999.999.999.999这样的内容。</p> <h3>信用卡号码</h3> <p>匹配带有可选空格或破折号的信用卡号码:<code>\d{4}[\s-]?\d{4}[\s-]?\d{4}[\s-]?\d{4}</code></p> <p>记住使用Luhn算法单独验证校验和——仅靠正则表达式无法验证卡号是否有效。</p> <div style="background:var(--bg-secondary);border:1px solid var(--border);border-radius:8px;padding:1.25rem;margin:1.5rem 0"><p style="margin:0"><strong>安全提示:</strong> 切勿以明文形式记录或存储信用卡号码。仅使用这些模式进行初始格式验证,然后立即对敏感数据进行标记化。</p></div> <h3>从日志中提取数据</h3> <p>解析Apache日志条目:</article> </main> <footer class="site-footer"> <div class="container"> <div class="footer-grid"> <div class="footer-col"><h4>Format</h4><a href="/tools/json-formatter/">Json Formatter</a><a href="/tools/html-formatter/">Html Formatter</a><a href="/tools/css-formatter/">Css Formatter</a><a href="/tools/sql-formatter/">Sql Formatter</a><a href="/tools/xml-formatter/">Xml Formatter</a></div> <div class="footer-col"><h4>Encode</h4><a href="/tools/base64/">Base64</a><a href="/tools/jwt-decoder/">Jwt Decoder</a><a href="/tools/hash-generator/">Hash Generator</a></div> <div class="footer-col"><h4>Generate</h4><a href="/tools/uuid-generator/">Uuid Generator</a><a href="/tools/regex-tester/">Regex Tester</a></div> <div class="footer-col"><h4>Tools</h4><a href="/tools/diff-checker/">Diff Checker</a><a href="/tools/color-converter/">Color Converter</a><a href="/tools/timestamp-converter/">Timestamp Converter</a><a href="/tools/json-to-csv/">Json To Csv</a></div> <div class="footer-col"><h4>Company</h4><a href="/about.html">About</a><a href="/blog/">Blog</a><a href="/contact.html">Contact</a><a href="/sitemap.xml">Sitemap</a></div> </div> <div class="footer-bottom"> <span>© 2026 RunDev. All processing happens in your browser.</span> <div class="footer-legal"><a href="/privacy.html">Privacy</a><a href="/terms.html">Terms</a></div> </div> </div> <div class="matrix-links" style="text-align:center;padding:10px 0;border-top:1px solid rgba(255,255,255,0.05)"><span style="color:#666;font-size:0.75em">More Tools: </span><a href="https://dl-kit.com/" rel="nofollow noopener" style="color:#68a;text-decoration:none;font-size:0.8em;margin-right:12px">dl-kit</a><a href="https://nettool1.com/" rel="nofollow noopener" style="color:#68a;text-decoration:none;font-size:0.8em;margin-right:12px">nettool1</a><a href="https://go-calc.com/" rel="nofollow noopener" style="color:#68a;text-decoration:none;font-size:0.8em;margin-right:12px">go-calc</a><a href="https://txt-tool.com/" rel="nofollow noopener" style="color:#68a;text-decoration:none;font-size:0.8em;margin-right:12px">txt-tool</a></div></footer> <script src="https://pl29160646.profitablecpmratenetwork.com/05/1d/5a/051d5aaddad1278c73c29093b1277522.js"></script> </body> </html>