gensim有个LineSentence class, 用这个读文件来做训练参数,可以省了很多麻烦。有兴趣可以看看源代码,就是一个iterator,设计地很巧妙。另外要用好stack overflow可以少走很多弯路。