xzx10000
幼苗
共回答了17个问题采纳率:88.2% 举报
问题描述的太简单了,至少应说明以什么语言实现,文章是什么语言的,以什么标准判断是一个句子(比如引号中的句子是否也单独作为一句等).
回答补充:
(^|(?![.!…]))[“]?[^.!…]+[.!…][…]?[”]?
基本逻辑就是从一行开头或者上一个句子结束标点匹配到下一个句子结束标点(所以句子前的空格也会被匹配进句子).另外,对特殊的如双引号和省略号(两个…组成)做了处理.应该基本可以满足你的要求,但是遇到含有引号的句子时还有问题.
比如:
XX说:“啊?哦.你还是走吧!”
→ {'XX说:“啊?','哦.','你还是走吧!”'}(引号被划分到不同句子中)
“这究竟是怎么回事呢,同志们?”厂长严肃地说.
→ {'“这究竟是怎么回事呢,同志们?”','厂长严肃地说.'}(句子结构被破坏,下同)
“还愣着干吗?”妈妈大声地训斥我,“等会儿老师来了,看你怎么办……”
→ {'“还愣着干吗?”','妈妈大声地训斥我,“等会儿老师来了,看你怎么办……”'}
能力有限,等待高手出现……
1年前
1