申请回电

支持

对惠普 Z 系列数据科学解决方案的第一印象

2020 年秋

高级算法工程师

作为惠普 Z 系列全球数据科学大使,Yuanhao Wu 的内容由惠普赞助,且向他提供了惠普产品。

 

大家好,我是 Yuanhao,这是我的第一篇博文。我想简单介绍一下我自己,谈谈我和 AI 的故事,以及我最近使用惠普 Z 系列工作站的体验。这款采用 NVIDIA GPU 的工作站来自惠普,是惠普为我提供的赞助。

 

我住在中国上海,是一名 NLP 工程师。在过去几年中,我一直活跃在 Kaggle 竞赛场上。我总共参加了 20 多场 Kaggle 比赛,赢得了几块金牌。2019 年,我晋升为 Kaggle Competition Grandmaster,我的 Kaggle 最高排名是全球第 36 位。

 

我第一次较为系统地学习人工神经网络是在 2016 年,我选择将 Hinton 大神的公开课《机器学习神经网络》(Neural Network for Machine Learning) 作为入门课程。那时我使用的电脑还没有配备 GPU,我只能通过压榨 CPU 来完成课后作业。

 

2017 年从大学毕业后,我终于有机会在工作中使用专用的 GPU 资源。那是一台搭载 NVIDIA Quadro P4000 GPU 的 HP Z4 工作站。得益于这项技术提供的强大支持,我开始探索高阶模型,之后还参加了 Kaggle 竞赛。这台 Z4 工作站是我人生新篇章的重要起点。

 

为了在 Kaggle 竞赛中取得好成绩,我在 2019 年自己动手组装了一台台式电脑,它搭载了英特尔 i7 CPU、32 GB RAM 和 NVIDIA 2080Ti GPU。11 GB 的 VRAM 使我能够训练当时的大多数模型,比如 BERT-base 和 BERT-large。这台电脑的整体表现非常出色,但散热能力稍显不足。我选择的是 MATX 机箱,其非常紧凑,且不利于散热。此外,我的 GPU 主要用来玩游戏,使用的是常见的空气冷却器。空气冷却器会直接将热空气排到机箱内。在训练模型时,机箱的玻璃侧板会变热。因此,我必须打开机箱,以保 GPU 温度低于温度墙。

 

这就是我之前自己组装的台式电脑。机箱的侧面板总是处于打开状态。

近年来,Transformer 模型的发展取得了长足的进步。模型变得越来越大。大家可能在许多新闻报道中看到过 GPT-3 模型,这个模型拥有 1750 亿个参数。虽然我们在实际生产和 Kaggle 竞赛中都很少使用如此庞大的模型,但如今想要赢得 Kaggle 竞赛,确实不能再指望过去那些小规模的模型了。在 Jigsaw 多语言恶毒评论分类竞赛中,获胜者都不约而同地使用一种名为 XLM-Roberta-Large 的模型,它能够处理超过 100 种语言。因此,它涉及的词汇非常广泛,嵌入层也很大(XLM-Roberta-large 的词汇量为 250002,相比之下 Roberta 的词汇量仅为 50265)。由于 VRAM 的限制,我自己的 2080Ti GPU 在训练模型时很难取得理想的效果。

 

业内人士都在使用性能更为强大的设备来训练模型。例如,我之前工作过的公司就有好几台 DGX-1 服务器。每台 DGX-1 服务器都配备 8 个具有 32 GB VRAM 的 NVIDIA V100 GPU。如此大的 VRAM 可以容纳几乎所有模型。但是,V100 GPU 的价格非常昂贵,远远超出了普通人的承受能力。

 

如今,VRAM 已不再是我的拦路虎。2020 年成为惠普 Z 系列全球数据科学大使后,惠普提供的全新 HP Z4 工作站和 ZBook Studio 便成为了我探索路上的得力助手。惠普 Z 系列工作站让一切都变得更轻松,这种感觉真是太棒了!

 

我使用的工作站搭载了 i9 10980XE、128 GB RAM、2 个具有 24 GB VRAM 的 RTX 6000 GPU、2 TB SSD + 6 TB HDD 存储空间,兼具强劲性能与均衡表现。我认为 RTX 6000 GPU 是中小型 AI 应用的明智之选。如果您想使用上文提到的 XLM-Roberta 这类大型模型,24 GB VRAM 不仅可以满足您的需求,而且价格远低于 V100。

 

除此之外,我认为这台电脑的设计理念也很棒!转动开关即可轻松打开侧面板,电脑的整个结构就会呈现在眼前,既小巧又精致。冷却系统的效果非常出色。温度和噪音能够得到很好的控制,即便是两个 GPU 满负荷运转,电脑也能“尽在掌控”。

 

这是一台 HP Z4 工作站,外形小巧紧凑,冷却系统的效果非常出色。

接下来我想谈谈 ZBook Studio,它为我带来了全然不同的开发体验。之前,我时常因为手边没有方便使用的 GPU 资源,难以实现或调试深度学习模型而备受困扰。这种情况在公司中很常见,因为 GPU 资源通常部署在云端,而员工使用的笔记本电脑并未配备 GPU。借助 ZBook Studio 搭载的 RTX 5000 GPU,我可以随时随地轻松地设计和调试 NN 模型。令人惊讶的是,这台笔记本电脑的 VRAM 高达 16 GB,甚至比我之前使用的配备 2080Ti 显卡的台式电脑还要大!

 

除了硬件之外,这款电脑预装的软件同样带给我不小的惊喜。惠普一直致力于帮助用户充分发挥产品的优势,而且成绩斐然。之前,为了在我自己组装的电脑上搭建所需的开发环境,我花费了大量的时间和精力。而现在,预加载的数据科学软件堆栈几乎包含需要的一切资源,比如 GPU 驱动程序、CUDA、开发人员工具和常用的库。大家收到新电脑后就可以立即开工。不仅如此,惠普还提供了许多有用的工具,旨在全面提升电脑的生产力。其中一些工具只在 Z 系列产品上才有。

 

距离我上次参加 Kaggle 竞赛已经有一段时间了。今年,有了惠普 Z 系列工作站和 ZBook Studio 的强大助力,我计划将多放些时间在变体社区 (variant community) 上。我也会持续分享关于 Kaggle、NLP 和 AI 的内容。我已经着手准备参加 RANZCR CLiP - 导管与线路位置挑战赛。工作站的模型训练速度非常快,我很满意。很期待与大家分享我的新进展。

有疑问?
联系销售支持。 

不知道该怎么选
Z 系列工作站?

申请回电

 需要 Z 系列工作站方面的支持?

前往支持页面

免责声明

  1. 产品的Logo及位置可能与图片有所差异,不影响产品性能和功能,请以实物为准。

     

    产品图片仅供参考,因不同国家可能存在稍许差异,实际产品以销售为准。

     

    本文所载信息如有变更,恕不另行通知。惠普产品与服务的完整保修条款见此类产品和服务附带的正式保修声明。本文中的信息概不构成额外的保修条款。惠普对本文包含的技术或编辑方面的错误或遗漏概不负责。