全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 python论坛
1022 4
2017-06-06
悬赏 50 个论坛币 未解决
需要提取一部分文本进行处理,不知道如何用正则表达式进行匹配(或者有更好的方法)?
QQ图片20170606171349.png 如图,需要抽取Z4与CR之间的内容,不知道用什么方法,求大神解答。。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2017-6-7 08:55:55
首先应该放上文本,其次应该放多个例子。代码及图片如下:
import re
text = 'Z4 阿西吧阿巴西\n西吧阿。\nCR biubiubiu'#你的文本
model = 'Z4(.*?)CR'#要匹配的模式
pattern = re.compile(model, re.S)#匹配换行符
data = re.findall(pattern, text)#匹配结果
附件列表
RTX截图未命名.png

原图尺寸 220.99 KB

RTX截图未命名.png

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-6-7 09:29:21
#!python3
# temp - to find the chinese text in the whole passage

import re,pyperclip
##
text=str(pyperclip.paste())

chineseRegex=re.compile(r'选择黑.*转化。',re.DOTALL)
text1=chineseRegex.findall(text)
print('Here is the text copied:')
print(' '.join(text1))
pyperclip.copy(' '.join(text1))

##不知道这样可不可以,写得不好还请海涵
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-6-7 13:48:48
恩恩。我试一下。谢谢了
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-6-9 14:08:31
这是要处理的文本
附件列表

savedrecs.txt

大小:628.2 KB

 马上下载

文本

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群