我对深度学习很陌生,并试图使用深度学习解决多类、多标签文本分类的问题。
https://github.com/fchollet/keras/blob/master/examples/imdb_cnn_lstm.py。我有另一个数据集。csv 文件(“文本”,“分类器”)的 int 形式,我想在其上执行文本分类任务。我已经尝试了几种方法将我的训练文本传递给 keras,但不能,所以我被困在这一点上。谁能建议我如何将我的“train.csv”和“test.csv”文件传递给 X_train、y_train 和 X_test、y_test?
通常卡在这条线上。
(X_train, y_train), (X_test, y_test) = imdb.load_data(nb_words=max_features)
'train.csv' 具有以下格式:
“职位描述:理想的人选是在尖端的工业分析专业数据科学组织中应用他/她的高级分析专业知识;主要是在以下任何领域-汽车/能源/石油和天然气/航空航天/海洋/化学。经验在统计建模,预测建模,随机森林,决策树,线性回归,相关性,时间序列。机械/或/ IE/计算机科学/EE/化学的BE / MS /博士。导师/领导一个数据科学家的小团队“,商业分析
'test.csv' 具有与 "job_description","category" 相同的格式