第225章 transformer

随着数据标注完成,齐凡开始用Mars 1.0组建的算力卡矩阵跑模型训练。

连着一周跑下来,模型训练的效果出乎齐凡意料--非常糟糕。

以至于齐凡茶不思饭不想,一连几天都在思考问题出在何处,甚...

后续精彩内容,上QQ阅读APP免费读