问题描述
我们在进行数据处理时,可能经常需要对不同类型的字符进行抽取。比如一些产品型号,批次之类的会使用字母表示,这个时候该如何提取这些数据呢?
问题分析
不管是字母,还是数字,我们都可以使用相应的匹配规则来抽取出来。但是由于字母是混合在字符串中,我们需要循环对其进行匹配。
具体解法
我们创建一个函数,通过调用这个函数来找出所有的字母。
CREATE FUNCTION dbo.GET_LETTER (@Str VARCHAR(100))
RETURNS VARCHAR(100)
AS
BEGIN
WHILE PATINDEX('%[^a-z]%', @Str) > 0
BEGIN
SET @Str = STUFF(@Str, PATINDEX('%[^a-z]%', @Str), 1, '');
END;
RETURN @Str;
END;
GO
代码解读
上面的解法主要使用了两个函数,PATINDEX函数和STUFF函数
PATINDEX函数
PATINDEX ( '%pattern%' , expression )
返回pattern字符串在表达式expression里第一次出现的位置,起始值从1开始算。
例如
SELECT PATINDEX('%SQL%','SQL数据库开发')
结果:
因为SQL就在第一位,所以返回结果为1
STUFF函数
STUFF ( expression1 , start , length ,expression2 )
字符串expression1 从start位置开始,删除长度为length的字符后,在start后面填充expression2。
例如
SELECT STUFF('SQL,开发',4,1,'数据库')
结果:
上面的示例是将","删除后,替换成了"数据库"
测试函数
理解完上面的函数,我们来测试一下我们自定义的函数GET_LETTER ()
SELECT dbo.GET_LETTER('SQL数1据2库3开4发road')
结果:
这与我们预期的结果一致,证明这个自定义函数是可行的。
觉得不错,欢迎转发分享给更多人,让有需要的人也看到。
原文地址:https://mp.weixin.qq.com/s?__biz=MzA3MTg4NjY4Mw==&mid=2457315217&idx=2&sn=8b174399998c94ba1763514c982d4792&chksm=88a5b5a5bfd23cb3f69e7378a9f5ab9de1679ff6cf3222992ebf6ce9b2815217e5cdbc5d9cc6&mpshare=1&