`
terrencexu
  • 浏览: 121635 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

Java: CSVUtils

    博客分类:
  • Java
阅读更多

解析CSV文件,最简单,最直接,最突然的想法就是

 

"a,b,c,d".split(",")

 

但是如果复杂一点儿,加上一些特殊字符,比如引号“"”,逗号“,”,那你就会发现split(",")不灵光了。于是今天就闲着没事儿写了一个,没有完全测试,但是应该没问题,哈哈

package com.javaeye.terrencexu.csv

import java.util.LinkedList;
import java.util.List;

public final class CSVUtils {

	private CSVUtils() {}
	
	private static char fieldSep = ',';

	private static List<String> fields = null;

	/**
	 * This function will split the input on commas. It needs to decide whether
	 * to parse normally or consider special scenarios like "AA,BB". This
	 * function returns the number of fields present in the input.
	 * 
	 * @param line
	 * @return
	 */
	public static List<String> split(String line) {
		fields = new LinkedList<String>();
		
		if (line.length() == 0) {
			return null;
		}
		
		int curPos = 0;
		
		while(curPos <= line.length()) {
			if (curPos < line.length() && line.charAt(curPos) == '"') {
				curPos = parseQuoted(line, ++curPos);
			} else {
				curPos = parsePlain(line, curPos);
			}

			curPos ++;
		}

		return fields;
	}
	
	public static List<String> split(String line, char separator) {
		fieldSep = separator;
		
		return split(line);
	}

	/**
	 * This function will parse all fields that are not in quotes.
	 * 
	 * @param line
	 * @param curPos
	 * @return
	 */
	private static int parsePlain(String line, int curPos) {
		int nextSepPos;

		nextSepPos = line.indexOf(fieldSep, curPos);

		if (nextSepPos == -1) {
			fields.add(line.substring(curPos));
			return line.length();
		} else {
			fields.add(line.substring(curPos, nextSepPos));
		}
		
		return nextSepPos;
	}

	/**
	 * This function will parse all fields that are in quotes.
	 * 
	 * @param line
	 * @param curPos
	 * @return
	 */
	private static int parseQuoted(String line, int curPos) {
		int tmpPos;
		String fld = "";
		
		for (tmpPos = curPos; tmpPos < line.length(); tmpPos++) { 
			if (line.charAt(tmpPos) == '"' && tmpPos + 1 < line.length()) { 
				if (line.charAt(tmpPos + 1) == '"') { 
					tmpPos++; 
				} else if (line.charAt(tmpPos + 1) == fieldSep) { 
					tmpPos++;
					break;
				}
				
			} else if (line.charAt(tmpPos) == '"' && tmpPos + 1 == line.length()) {
				break;
			}
			
			fld = fld + line.charAt(tmpPos); 
		}
		
		fields.add(fld);
		
		return tmpPos;
	}

}

 

测试一把:

public static void main(String[] args) {
	String line = "col_1,Test,\"{\"\"key\"\":\"\"date\"\",\"\"order\"\":\"\"desc\"\"}\",,,,application/xml";
	String line2 = "a|b|\"|\"|d";
	
	System.out.println(CSVUtils.split(line));
	System.out.println(CSVUtils.split(line2, '|'));
}

 运行结果:

[col_1, Test, {"key":"date","order":"desc"}, , , , application/xml]

[a, b, |, d]

 

 -- Done --

 

3
3
分享到:
评论

相关推荐

    java: 非法字符

    使用java解决 java: 非法字符: '\ufeff“ 问题

    Optimizing Java: Practical Techniques for Improving JVM Application Performance

    Learn how Java principles and technology make the best use of modern hardware and operating systems Explore several performance tests and common anti-patterns that can vex your team Understand the ...

    Java, Java, Java:java,java,java.pdf

    Java, Java, Java:java,java,java.pdf

    疯狂Java:突破程序员基本功的16课(修订版)_真正修订版_带书签_高清完整版

    李刚 著 ISBN:9787115263049

    Java安卓:猜地鼠游戏.zip

    Java安卓:猜地鼠游戏.zipJava安卓:猜地鼠游戏.zipJava安卓:猜地鼠游戏.zip Java安卓:猜地鼠游戏.zipJava安卓:猜地鼠游戏.zipJava安卓:猜地鼠游戏.zip Java安卓:猜地鼠游戏.zipJava安卓:猜地鼠游戏.zipJava...

    IDEA解决Java:程序包xxxx不存在的问题

    主要介绍了IDEA解决Java:程序包xxxx不存在的问题,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下

    java:Java发现

    JavaJava发现

    JAVA校友录 操作ACCESS库

    UpdateDialog.java:查询、添加、修改记录窗体 DataBase连接数据库项目 Access.java:用于连接access数据库的代码 DataBase.jar:该项目打成的jar包,用于连接access数据库 提取出SchoolBook.jar、DataBase.jar...

    commons-beanutils-1.7.0

    at org.apache.catalina.loader.WebappClassLoader.findClassInternal(WebappClassLoader.java:1817) at org.apache.catalina.loader.WebappClassLoader.findClass(WebappClassLoader.java:872) at org.apache....

    java:大数据文件写入,读取,分割,排序,合并

    java:大数据文件写入,读取,分割,排序,合并

    Java多线程编程总结

    Java 线程系列博文总结word化,编目如下,欢迎互相学习交流: Java线程:概念与原理 Java线程:创建与启动 Java线程:线程栈模型与线程的变量 Java线程:线程状态的转换 Java线程:线程的同步与锁 Java线程:...

    Java毕业设计:学生宿舍管理系统源码.zip

    Java毕业设计:学生宿舍管理系统源码 Java毕业设计:学生宿舍管理系统源码 Java毕业设计:学生宿舍管理系统源码 Java毕业设计:学生宿舍管理系统源码 Java毕业设计:学生宿舍管理系统源码 Java毕业设计:...

    java8看不到源码-puppet-oraclejava:使用无限JCE管理oraclejava7和java8

    oraclejava::install 或者 class { 'oraclejava::install': } 默认行为是安装具有无限 JCE 的 java8。 它不会自动升级。 如果你想升级java8,你可以使用ensure参数: class { 'oraclejava::install': ensure =&gt; '...

    CSVUtils.java

    csv导出导入工具类,用于导出和导入csv文件的工具类,非要说50个字的描述,办不到啊,没这么多话,自己看

    LearnJava:了解Java

    Usage.java:ThreadStates (枚举类型)和ThreadStatesConstant(类) ThreadStates.java :枚举类型 ThreadStatesConstant.java :类 ThreadStatesEnum.java :枚举类型정리및枚举类型 JavaEnumExample.java :

    Java 线程总结

    Java线程:概念与原理 Java线程:创建与启动 Java线程:线程栈模型与线程的变量 Java线程:线程状态的转换 Java线程:线程的同步与锁 Java线程:线程的交互 Java线程:线程的调度-休眠 Java线程:线程的调度-优先级 ...

    mysql-connector-java-8.0.28

    java连接mysql的稳定驱动

    org.eclipse.jdt.core_3.5.2.v_981_R35x

    org.drools.RuntimeDroolsException: Unable to load dialect 'org.drools.rule.builder.dialect.java.JavaDialectConfiguration:java:org.drools.rule.builder.dialect.java.JavaDialectConfiguration' at org....

    swing-worker-1.1.jar

    at java.awt.event.InvocationEvent.dispatch(InvocationEvent.java:209) at java.awt.EventQueue.dispatchEvent(EventQueue.java:633) at java.awt.EventDispatchThread.pumpOneEventForFilters(EventDispatch...

Global site tag (gtag.js) - Google Analytics