From d698911bc9bf7cb431bce939412131a90f24ee45 Mon Sep 17 00:00:00 2001 From: toasted-nutbread Date: Sat, 9 Jan 2021 19:02:51 -0500 Subject: Refactor sentence scanning (#1213) * Update tests * Update extractSentence implementation * Remove old extractSentence implementation * Optimize maps/sets --- test/data/html/test-document1.html | 48 ++++++++++++++++++++++++++++++++++++++ 1 file changed, 48 insertions(+) (limited to 'test/data') diff --git a/test/data/html/test-document1.html b/test/data/html/test-document1.html index 98a6fb44..37dbb017 100644 --- a/test/data/html/test-document1.html +++ b/test/data/html/test-document1.html @@ -43,6 +43,54 @@ 真白「心配してくださって、ありがとございます」 +
+ 真白「心配して「くださって」、ありがと「ございます」」 +
+ +
+ ありがとございます。ありがとございます。 +
+ +
+ ありがとございます。ありがとございます。 +
+