今日快看!一日一卡挑战:RTX2080Ti搞定大模型训练,算力节省136倍,学界欢呼 机器之心报道编辑:小舟、泽南任何transformer变体、任何数据集都通用。在一块消费级GPU上只用一天时间训练,可以得到什么样的BERT模型?最近 2022-12-31