Java读取Csv实例所应该注意的事项

东坡下载 2011年04月26日 12:00:10

      Csv文件,逗号分隔的常用数据文件格式,默认可以用Office软件打开。 ]_ fx nu
      维基百科对CSV的详细描述: 看项目中以前的处理方式是直接用用java IO类库读取Csv文件,实际处理中发现Csv文件本身包含了对各种特殊字符的处理信息。最常见的比如: kC> uk( 8v
      1. 对包含特殊字符的字符串数据首尾加双引号 KoM'`oY 2
      2. 对数据中的单个双引号前加单个双引号 (<= 2FA P_
      其它... PpFCQsnS #
      所以用Java IO读到的字符串全是经过处理后的字符串,在某些场景下是不符合预期需求的。比如我需要的是不做任何处理的原始内容。 fy5M4 项目中另一种常见的文件格式Excel用了POI来处理,但是POI不支持Csv格式,于是找到了javacsv。 ,#FT4 i;F/
      代码很简单: z#zQ 7v`H
      Java代码 YIhh y P
      public List importCsv(String file) { hq^ v+bCI
      List list = new ArrayList(); wV 5:88 f
      CsvReader reader = null; `brM,x^0_
      try { U#F Kn8
      //初始化CsvReader并指定列分隔符和字符编码 T >![2R Bl
      reader = new CsvReader(file, ',', Charset.forName("GBK")); > } `%"-*c
      while (reader.readRecord()) { $k8) *ZoX
      //读取每行数据以数组形式返回 ywl5O=kL
      String[] str = reader.getValues(); m j3?7 a q
      if (str != null && str.length > 0) { 3q# :5N.
      if (str[0] != null && !"".equals(str[0].trim())) { q Ej"T C
      list.add(str); 7Qz2w\9K
      } T [a2(t O
      } +4lefN` G&
      } ! LVKo&x:
      } catch (FileNotFoundException e) { d)I ) nn![
      log.error("Error reading csv file.",e); g-KSV J
      } catch (IOException e) { ^(9 !{HP3]
      log.error("",e); F^ PV< Y
      } lY,O 1 )}|
      finally{ = MOo:Xz
      if(reader != null) ! >nk5]Hp
      //关闭CsvReader N_s iM 35-
      reader.close(); ~}] L r
      } |K = a :
      return list; - o"PK`|
      } R}q Kz4Bg
      以上代码有几个要点: - 8:w _/|#
      1 初始化CsvReader时指定分隔符和字符编码,如果不指定,默认分别为逗号和ISO-8859-1,我用了GBK,具体使用时要看当时的字符编码而定。 ml M:7(+d
      2 读取每行数据,返回字符串数组,数组内的顺序即文件数据列的顺序 easc CFna
      3 最后记得关闭CsvReader 3 ^DJGA 9
      是不是很简单,返回的数组格式也正好是我想要的,而且拿到是原始的数据,没有经过特殊字符处理。 !*= 0Ydk
      有些童鞋质疑特殊字符未经处理,插到数据库会出错,其实大可不必我们手工处理,一些基础组件比如JDBC的preparedstatement已经包含了对特殊字符的处理,我们只要以绑定参数的形式来传送这些包含特殊字符的数据就可以。常用的持久化框架底层也封装了JDBC,自然也对特殊字符做了处理。 vDh#^T1h+8