前天刚入职的算法同事,过来问我怎么提取txt文件中的数据,我一看这还不简单,结果…搞了好久。
正则不用真的会忘记,写篇博客增加一下记忆吧。
需求:提取txt文件中,有特定开头(双引号),特定结尾(双引号)的中间的数据,打印出来
FileInputStream:是java中的字节输入流,就是通过字节的形式进行读取
构造方法可以通过传递指定打开文件的路径字符串,来创建FileInputStrem对象
InputStremReader是连接字节流和字符流之间的桥梁,我们通过newInputStremReader()的构造方法,传递一个FileInputStrem对象,和一个编码格式,这个编码格式具体根据你要读取文件的编码格式
编码格式可以打开txt文件在右下角查看
//这里利用了一下小技巧就是我这个同事给我的文件每个要提取的数据都在同一行内,所以可以通过每行读取。
正则表达式匹配规则这里是以(ox)开始以“结尾这里的第一对括号防止防止转义所以加了\然后()表示一个子表达式的开始和结尾要匹配这两个字符的话就用上面的\.表示匹配任意*表示匹配任意多个\”表示匹配最后字符这里的规则大概就是这样,可以根据需要自己匹配
pattern是正则表达式的编译形式匹配的模式Pattern.compile是获取Pattern实例,Pattern的构造器是私有的,只能通过compile方法获取
matcher类也是私有的,只能通过pattern.matcher来创建,构造方法传递一个参数时,返回一个matcher实例,是匹配上的字符串构造方法传递两个参数时,返回一个boolean值,表示是否匹配上指定的字符串
m.find()是部分匹配,从给定的字符串开始匹配,第一次匹配到之后如果没有重置,则会从上次匹配到的最后一个字符的下一位开始往后匹配匹配成功后会返回true
m.group()是返回匹配的数据group(0)是返回原始匹配的数据group(1)是返回第一次匹配到的数据
效果展示,直接将结果从控制台复制使用即可
注意:控制台展示的数目有限,如果出现前半部分丢失,可能是控制台展示的数据达到上限,可以通过输出到指定文件或者exel文件中
到此这篇关于java正则匹配读取txt文件提取特定开头和结尾的字符串的文章就介绍到这了,更多相关java提取txt文件中指定内容内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!