Perl正则匹配数字：实用技巧与常见场景

发布时间：2026-01-01 05:40:30 阅读：57 次

ref="/tag/2/" style="color:#643D3D;font-weight:bold;">Perl正则匹配数字的基本写法

在处理文本数据时，经常需要从一堆字符中找出数字。比如读取日志文件时提取响应时间，或者从网页抓取的价格信息中剥离金额。Perl 的正则表达式在这方面非常趁手，写起来也直观。

最简单的匹配一个或多个数字，可以用 \d+。这个模式能匹配连续的数字字符，比如 123、4567 都没问题。

my $text = "订单总价：899元";
if ($text =~ /(\d+)/) {
    print "找到数字: $1\n";
}

这段代码会输出“找到数字: 899”。这里的括号用于捕获匹配的内容，$1 就是第一个捕获组的结果。

有时候不只是要整数，还可能需要小数。比如价格常常带小数点，像 29.9、0.5 这样的。这时候可以扩展一下模式：

my $price = "单价：29.9 元";
if ($price =~ /(\d+\.\d+)/) {
    print "价格是: $1\n";
}

这里用到了 \. 来匹配小数点本身，因为 . 在正则里有特殊含义（匹配任意字符），所以要转义。这样就能准确抓到带小数的价格了。

实际工作中，一条信息里往往不止一个数字。比如一条记录写着“用户ID:10086，登录次数:32，最后在线:2024-05-20”，想把三个数字都拿出来。

可以用全局匹配修饰符 g，配合循环处理：

my $log = "用户ID:10086，登录次数:32，最后在线:2024-05-20";
my @numbers = $log =~ /\d+/g;
print "提取到的数字：@numbers\n";

运行后会输出：提取到的数字：10086 32 2024 05 20。注意日期也被拆成了两个数字，如果只想拿前面的 ID 和次数，就得限制上下文：

my @ids = $log =~ /ID:(\d+)/g;
my @times = $log =~ /次数:(\d+)/g;

这样更精准，避免误抓不需要的数据。

有些场景下，你不希望把日期、身份证号这种长串里的部分当成普通数字。可以通过边界限定来控制。

比如用 \b 表示单词边界，确保匹配的是完整的数字块：

my $str = "房间号101A，温度25度";
if ($str =~ /\b(\d+)\b/) {
    print "独立数字: $1\n";
}

这里会匹配到 25，而不会把 101A 中的 101 当作独立数字，除非你明确需要它。根据业务逻辑灵活调整即可。

数值不全是正整数。遇到负数如 -45，或者极小值写成 1.2e-6，普通 \d+ 就不够用了。

可以组合符号来覆盖这些情况：

my $num_str = "测量值：-1.2e-6";
if ($num_str =~ /(-?\d+(\.\d+)?(e-?\d+)?)/i) {
    print "完整数值: $1\n";
}

这个正则解释一下：-? 表示可能有负号；(\.\d+)? 是可选的小数部分；(e-?\d+)? 匹配科学记数法，i 修饰符让 e 和 E 都能匹配。虽然看起来复杂一点，但一次写好，以后直接复用。

这类写法在解析程序输出、自动化报表提取时特别有用，省得手动一个个看。