求 分割文章成句子的 正则表达式.

求 分割文章成句子的 正则表达式.
正则表达式 分割文章成句子,这样一句一行写到数据库中
分割句子的符号就是正常的通常句子符号 句号 感叹号 问号等很多 两个换行也当前句子,我就是不知道这些符号,和正则表达式的算法格式,
用正则表达式的查找方法把 每一句话都查找出来.
xinhaoJJJ 1年前 已收到1个回答 举报

xzx10000 幼苗

共回答了17个问题采纳率:88.2% 举报

问题描述的太简单了,至少应说明以什么语言实现,文章是什么语言的,以什么标准判断是一个句子(比如引号中的句子是否也单独作为一句等).
回答补充:
(^|(?![.!…]))[“]?[^.!…]+[.!…][…]?[”]?
基本逻辑就是从一行开头或者上一个句子结束标点匹配到下一个句子结束标点(所以句子前的空格也会被匹配进句子).另外,对特殊的如双引号和省略号(两个…组成)做了处理.应该基本可以满足你的要求,但是遇到含有引号的句子时还有问题.
比如:
XX说:“啊?哦.你还是走吧!”
→ {'XX说:“啊?','哦.','你还是走吧!”'}(引号被划分到不同句子中)
“这究竟是怎么回事呢,同志们?”厂长严肃地说.
→ {'“这究竟是怎么回事呢,同志们?”','厂长严肃地说.'}(句子结构被破坏,下同)
“还愣着干吗?”妈妈大声地训斥我,“等会儿老师来了,看你怎么办……”
→ {'“还愣着干吗?”','妈妈大声地训斥我,“等会儿老师来了,看你怎么办……”'}
能力有限,等待高手出现……

1年前

1
可能相似的问题
Copyright © 2024 YULUCN.COM - 雨露学习互助 - 16 q. 0.023 s. - webmaster@yulucn.com