专题推荐:金博士AI技术干货分享
【资料图】
文章推荐:硬核科普|深度学习主流开发框架解读和比较
本文的知识点
通过本文,读者可以从中学习和掌握的关键知识点,包括:
1. 深度学习框架:了解不同的深度学习框架,如PyTorch、TensorFlow和Keras,并理解每个框架的特定优势和使用场景。
2. 每个框架的技术细节:了解每个框架的技术规格,如所用的编程语言、操作的API级别,以及架构类型
3. 性能比较:理解这些框架在性能上的差异,如速度和处理大数据集的能力,例如Keras适合较小的数据集,而PyTorch和TensorFlow适合处理大数据集并提供高性能。
4. 如何选择合适自己或行业的框架:学习在选择深度学习框架时应考虑的因素,如数据集的大小和类型、可用性的模型集,社区支持以及部署相关的流程和工具等。
大应用对开发框架的要求
PyTorch 和 TensorFlow 都有其独特的开发历程和复杂的设计决策历史。之前,这使得比较两者变得是一个关于它们当前特点和未来特点的复杂技术讨论。鉴于两个框架自从创立以来都已迅速成熟,许多这些技术差异现在已经不再重要。
幸运的是,对于那些不希望听得昏昏欲睡的人来说,当前的 PyTorch 与 TensorFlow 的争论主要围绕三方面实践所需考虑的因素:
1. 模型可用性:随着深度学习领域的逐年扩大和模型相应地变得更大,从零开始训练最先进的模型已经不再可行。幸运的是,现在有许多最先进的模型公开可用,使用它们在可能的地方很重要。
2. 部署基础设施:如果训练出的性能良好的模型不能被利用,那训练它们就没有意义。降低部署时间至关重要,尤其是随着微服务业务模型越来越受欢迎;高效的部署有可能决定许多以机器学习为中心的业务的成败。
3. 生态系统:深度学习不再只是在高度控制的环境中的特定用例。AI正在为众多行业注入新的能量,因此,一个位于更大生态系统中的框架,可以为移动设备、本地和服务器应用程序提供开发支持变得很重要。此外,专用机器学习硬件的出现,如 Google 的 Edge TPU,意味着成功的实践者需要使用能够与这种硬件很好地集成的框架。
我们将依次探讨这三个实际考虑因素,然后提供我们对在不同领域使用哪个框架的建议。
模型可用性比较
从零开始实现一个成功的深度学习模型可能是一项非常棘手的任务,特别是对于如 NLP 这样的应用,其中工程和优化都很困难。SOTA(State-of-the-Art,最新的、最先进的)模型日益复杂,这对于小规模企业来,模型训练和微调都不太实际,甚至近乎不可能。初创公司和研究人员都没有计算资源来自己利用和探索这样的模型,因此,能够使用预训练模型进行迁移学习、微调或开箱即用的推理就显得非常宝贵了。
在模型可用性方面,PyTorch 和 TensorFlow 有着明显的差异。PyTorch 和 TensorFlow 都有自己的官方模型仓库,我们将在下面的生态系统部分探讨,但实践者可能希望使用其他来源的模型。
我们下面从三个维度来比较模型可用性:1)在 HuggingFace 上公开的模型所支持的框架类型数量, 2)出版的科研论文其研究所基于的框架类型, 3)基于网站 Paper-with-Code,对提供代码的论文所采用的框架类型进行统计分析。
HuggingFace
HuggingFace 是一家领先的人工智能公司,致力于开发和提供一流的自然语言处理(NLP)技术。它是名为Transformers库的开发者,该库是一个开源项目,提供了各种最新的深度学习模型,如BERT、GPT-2、GPT-3和T5等,供研究人员和开发者使用。这些模型广泛应用于文本分类、信息抽取、语义理解、自然语言生成等任务。
HuggingFace的Transformers库是NLP领域的一个重要资源,提供了丰富的预训练模型和相关工具,帮助开发者和研究人员简化开发过程,快速实现各类NLP任务。此外,Transformers库也是一个活跃的社区,研究者和开发者可以在其中相互学习,分享知识和经验。
除了Transformers库,HuggingFace还提供了一个在线模型库,用户可以在其中找到、分享和使用各种预训练模型。此外,HuggingFace还开发了一些其他工具,如Datasets库,这是一个开源的数据集库,用于处理和加载各种NLP数据集。总的来说,HuggingFace是推动当前NLP领域发展的重要力量,为研究和应用提供了极大的便利。
HuggingFace可以让你只用几行代码就将训练有素、调整优化过的 SOTA 模型纳入你的开发流程中。
当我们比较 HuggingFace 对 PyTorch 和 TensorFlow 模型的可用性时,结果有点令人惊讶。下面我们看到的是在 HuggingFace 上可用的模型总数的图表,这些模型要么仅限于 PyTorch 或 TensorFlow,要么适用于两种框架。可以看到,只能在 PyTorch 中使用的模型数量绝对压倒了竞争对手。几乎有92% 的模型仅支持 PyTorch,比2022 年的 85% 还要多。相反,只有大约 8% 的模型仅支持 TensorFlow,所有可用模型中只有大约 14% 支持 TensorFlow ,比2022年的 16%还要少。此外,2022 年新增了超过4.5 万个仅支持 PyTorch 的模型,而只增加了约 4 千个仅支持 TensorFlow 的模型。
图 1 HuggingFace 上的模型数量
如果我们把注意力集中在 HuggingFace 最受欢迎的 30 个模型上,我们会看到有趣的结果。所有模型都可在 PyTorch 中使用,和去年一样,没有任何模型只支持 TensorFlow。不过同时支持两种框架的模型数量已经从 19 增加到 23。
图 2 HuggingFace 上排名前 30 的模型
研究论文
专题推荐:金博士AI技术干货分享文章推荐:硬核科普|深度学习主流开发
向微山岛出发,携一壶泉水,驾一路轻车;采微山湖莲子,乘小舟一叶,赢
《乐队的夏天3》官宣阵容,那英担任导师,节目组可真敢请,那英,汪峰,杨
智通财经APP获悉,内险股早盘继续回落,截至发稿,新华保险(01336)跌4
以下是南华仪器在北京时间8月8日09:30分盘口异动快照:8月8日,南华仪
【日本6月贸易收支时隔19个月呈现顺差】日本财务省8日公布的6月国际收
截至2023年8月7日收盘,中华企业(600675)报收于元,下跌%,换手率%,成
建业地产是河南省内无人不知的房地产龙头,而中原银行曾经是该公司的第
据转会专家迪马济奥透露,今夏和米兰合同到期的门将塔塔鲁萨努即将加盟
8月7日,上证科创100指数正式上线,发布实时行情,科创板指数体系再添
粤高速A8月7日发布公告称,2023年8月23日(星期三)下午3:30,公司将在
关于皇马青训阿里巴斯最新动态Rodra:阿里巴斯将于明天前往阿尔梅里亚
清远海关文明创建工作小组一行前往佛冈县新时代文明实践中心开展结对共
英联股份(SZ002846,收盘价:12 54元)8月7日晚间发布公告称,结合当
医疗器械行业是医疗卫生体系建设的重要基础,具有高度战略性、带动性和
【妖股“炸”了!突然闪崩97%年内一度暴涨35倍!】8月7日,惠陶集团...
数据显示,长虹美菱连续3天K线收阳,“三连阳”形态出现,意味着后...
经过多年的发展,中国生猪养殖企业遍地开花,一大批优秀的生猪养殖企业
随着中国人民银行、国家外汇管理局2023年下半年工作会议的召开,明确指
文:晴风图:网络(若有侵权,请联系删除)爱情是美好的,可是也是
每经AI快讯,有投资者在投资者互动平台提问:请问贵公司生产的一体铸铁
成都大运会开赛以来,赛场内外留下许多精彩瞬间,深受各方关注与好评。
人民网福州8月6日电(杨春燕)“中国(福建)—东盟经贸合作论坛”8...
经常运动和很少运动的人,到底有什么区别?-健康人可以选择快走、游泳
1、凑齐枯叶灵或青云剑的材料用CE5 6 1或6 1文本搜索kyl或quj改成yjp进
新京报讯(记者张兆慧)8月7日,济川药业发布公告,全资子公司济川有限与
鉴定和田墨玉原石通常需要以下步骤:1 观察外观:检查和田墨玉原石的外
这是8月4日在德国法兰克福美因河畔拍摄的“美因河节”现场。为期4天...
行业普遍认为,若室温超导实现,将对磁悬浮列车、无损输电、量子计算机
20个丝网印刷的注意事项1 丝网的选用要根据印刷材料不同进行选择,例如