用最专业的眼光看待互联网
立即咨询由 Hao Huang、Carol Tong Min、Dai Zhang、Jianyu Zeng、Xuefeng Liu、Nick Jiang、Peiyang He 和 Tianjun Xiao 于 2023 年 10 月 17 日发表在 亚马逊机器学习的相关文章中。

在 亚马逊网路服务 (AWS) 中,我们不仅专注于向客户提供多样的技术解决方案,还致力于深入理解客户的业务流程。我们从第三方的角度讨论,帮助客户理清价值主张、收集痛点、提出适当解决方案,并制作最具成本效益和可用性的原型,帮助他们系统性地实现商业目标。
这种方法可以被称为 AWS 的 逆向工作,也就是从客户期望的结果开始,确认它们的价值,然后推导出需要完成的工作,最后实施解决方案。在实施阶段,我们也遵循 最小可行产品 的概念,努力快速形成能在几周内创造价值的原型,并进行迭代更新。
今天,我们将回顾一个 AWS 与新希望乳业合作建立云端智能农场的案例研究。通过本文,您将更加深入地了解 AWS 在建立智能农场方面所能提供的服务,以及如何在 AWS 专家的帮助下,将智能农场应用构建到云端。
牛奶是一种营养丰富的饮品,考虑到国家健康,中国积极推动乳制品行业的发展。根据 Euromonitor International 的数据,在 2020 年中国的乳制品销售额达到 6385 亿人民币,并预计到 2025 年将增至 8100 亿人民币。此外,在过去 14 年内,年均增长率达到 10,显示出快速增长的潜力。
另一方面,截至 2022 年,中国乳制品行业的收入大多仍来自液态奶。60的生鲜乳用于液态奶和酸奶,还有20用于奶粉,而用于高度加工产品如奶酪和奶油的比例很小。
液态奶是轻度加工产品,其产量、质量与生鲜乳密切相关。这意味著,如果乳制品行业想要将产能释放出来以专注于生产高度加工的产品、创造新产品,并进行更多的创新生物技术研究,必须首先改善并稳定生鲜乳的生产和质量。
作为乳业领导者的新希望乳业一直在思考如何提高牧场的运作效率,并提增生鲜乳的产量与质量。新希望乳业希望利用 AWS 的第三方视角和技术专业知识,推动乳品行业的创新。在新希望乳业副总裁及首席信息官胡柳彤的支持和推动下,AWS 客户团队开始整理牧场的运作及潜在创新点。
AWS 是云技术领域的专家,但要在乳品行业实现创新,仍需要乳制品主题专家的专业建议。因此,我们与新希望乳业生产技术中心副主任宋梁荣、牧场管理团队及营养师进行了多次深入访谈,以了解牧场面临的一些问题和挑战。
牧场的乳牛分为两类:乳牛 和 预备牛。乳牛是成熟并持续会产奶的牛,而预备牛是尚未达到产奶年龄的牛。大型及中型牧场通常会给予预备牛较大的开放活动区域,以营造更舒适的成长环境。
然而,无论是乳牛还是预备牛,都是牧场的资产,需要每月进行盘点。乳牛每天都需要挤奶,由于在挤奶时相对静止,盘点相对容易。然而,预备牛则在开放空间中自由活动,这使得盘点变得不便。每次盘点时,几名工作人员需要反复从不同区域计数预备牛,最后进行核对。这一过程耗时一到两天,经常出现计数不一致或不确定每只牛是否都已被计数的问题。
如果能迅速、准确地盘点预备牛,将能大幅节省时间。
目前,大多数乳业公司使用的品种是 荷斯坦牛,也就是我们熟知的黑白牛。尽管大多数乳业公司都使用相同品种,但不同公司和牧场之间的牛只产奶数量和品质依然存在差异,这是因为牛只的健康状况直接影响产奶量。
然而,牛只不像人类一样能自行表达不适,通常不会定期给数千头牛做体检的兽医也无法实际操作。因此,我们必须利用外部指标来快速判断牛只的健康状况。
牛的健康状况的外部指标包含 身体状况评分 和 跛行程度。身体状况评分一般与牛的体脂百分比相关,是长期的指标,而跛行是一个由腿部问题或足部感染等问题引起的短期指标,会影响牛的情绪、健康和产奶量。另外,成年荷斯坦牛的体重要超过 500 公斤,如果状态不稳定,会对其脚造成重大损害。因此,出现跛行的情况时,兽医必须及时介入。
根据 2014 年的一项研究,中国严重跛行的牛只比例可能高达 31。虽然自该研究以来情况可能有所改善,但农场的兽医数量极为有限,无法持续监控牛只的健康状态。当检测到跛行时,通常情况已很严重,治疗时间漫长且难度高,产奶量也受到了影响。
如果能及时检测到牛只的跛行,并促使兽医在跛行较轻的阶段进行介入,牛只的整体健康和产奶量将会提升,农场的运营表现会更佳。
对于畜牧业来说,饲料是最大的变动成本。为了确保饲料的品质和库存,牧场常常需要从国内外供应商那里购买饲料成分,并运送到饲料配方工厂进行加工。
现代饲料成分种类繁多,包括豆粕、玉米、苜蓿、燕麦草等,这意味著有许多变量参与其中。每种饲料成分都有自身的价格周期和波动。价格剧烈波动的时候,饲料的总成本可能会波动超过15,造成重大影响。
饲料成本波动,但乳制品价格在长期内相对稳定。因此,在其他条件不变的情况下,单纯由于饲料成本的变化,整体利润可能会出现大幅波动。
为了避免这些波动,当价格较低时需要考虑多储存一些原材料。但储存也需要考虑价格是否真的处于谷底,还要根据当前的消耗率考量应该购买多少饲料。
如果我们能精确预测饲料消耗量,并结合整体价格趋势提出最佳的购买时间和数量建议,将能降低成本,提高牧场的运营效率。
魔戒官网梯子显然,这些问题与客户提升 农场运营效率 的目标密切相关,解决的方法分别是 释放劳动力、提升产量 和 降低成本。通过对每个问题的难度和价值的探讨,我们选择以 提升产量 作为切入点,并优先解决跛行牛只的问题。
在讨论技术之前,我们必须先进行研究。这项研究由 AWS 客户团队与 AWS 生成 AI 创新中心合作,后者负责机器学习算法模型,而 AWS AI 上海实验室则提供有关最新计算机视觉研究的算法咨询,并与新希望乳业的专家农业团队共同进行研究。研究分为几个部分:
了解传统的基于纸张的跛行牛只识别方法,并建立基本的识别理解。确认现有解决方案,包括农场和行业内的使用情况。开展农场环境调研,了解物理状况和限制。通过学习资料和观察现场视频,团队们对跛行牛只影响及其识别有了基本的了解。读者也可以通过下方的动画图片了解跛行牛的基本姿势。
相比之下,健康牛只的姿势则相对正常。
跛行牛只的姿势和步态与健康牛只有显著差异。
在现有解决方案方面,大多数农场依赖兽医和营养师进行视觉检查来鉴别跛行牛只。在业界,有利用可穿戴步态计和加速度计进行识别的方案,以及利用分区衡量桥进行识别的方案,但这两者的成本都相对较高。对于竞争激烈的乳业,我们需要最小化识别的成本以及对专用硬件的依赖。
经过与农场兽医和营养师的讨论和分析之后,AWS 生成 AI 创新中心的专家决定使用计算机视觉 (CV) 进行识别,仅依赖普通的硬件:市售监控摄像头,这样不会对牛只造成额外负担,也降低了成本和使用门槛。
在决定这个方向后,我们造访了一个拥有数千头牛的中型农场,调查了牧场环境,确定了摄像头的安装位置和角度。
现在,来说说解决方案。基于 CV 的解决方案的核心包含以下步骤:
牛只识别:在单个视频帧中识别多头牛,并标记每头牛的位置。牛只追踪:在视频录制时,随著帧的变化持续追踪牛只,并为每头牛分配一个唯一编号。姿势标记:通过将牛的图像转换为标记点来减少运动的维度。异常识别:识别标记点的动态异常。跛行牛算法:对异常进行标准化以获取分数,确定牛的跛行程度。临界值确定:根据专家意见获取阈值。根据 AWS 生成 AI 创新中心专家的判断,前几个步骤是通用要求,可以用开源模型解决,而后面的步骤则需使用数学方法和专家介入。
为了平衡成本和性能,我们选择了 yolov5l 模型,这是一种中型的预训练模型,适用于牛只识别,输入宽度为 640 像素,在本场景中提供了良好的性价比。
在 YOLOv5 负责在单个图像中识别和标记牛只的同时,现实中的视频包含持续变化的多个图像帧。YOLOv5 不能识别在不同帧中属于同一头牛的对象。要实现跨多帧的牛只追踪,需要另一个模型叫做 SORT。
SORT 代表 简单在线和实时追踪,其中 在线 意味著它仅考虑当前和前帧进行追踪,而不考虑其他任何帧, 实时 意味著它能立即识别对象的身份。
在 SORT 开发之后,许多工程师进行了实现和优化,开发出了 OCSORT,该模型考虑了对象的外观,DeepSORT其升级版本 StrongSORT包含了人类外观,ByteTrack 利用二阶段绑联连结来考虑低置信度的识别。经过测试,我们发现,在我们的场景中,DeepSORT 的外观追踪算法对人类的覆盖率优于牛只,而 ByteTrack 的追踪准确性则稍弱。因此,我们最终选择了 OCSORT 作为追踪算法。
接著,我们使用 DeepLabCut简称 DLC标记牛只的骨架点。DLC 是一种无需标记的模型,这意味著虽然不同的部位,比如头部和四肢,可能有不同的意义,但它们对于 DLC 来说都只是 点,只需我们标记这些点并训练模型。
这引出了另一个问题:每头牛需要标记多少个点,以及应该标记哪些位置?这一问题影响到标记、训练及随后推断效率的工作量。为了解决这个问题,我们必须先理解如何识别跛行牛。
根据我们的研究及专家客户的意见,视频中的跛行牛只特征包括:
背部拱起:脖子和背部弯曲,形成一个三角形,从颈骨根部开始拱背。频繁点头:每一步可能导致牛只失去平衡或滑倒,造成频繁的 点头头部晃动。步态不稳:在几步之后,牛的步态会变化,出现稍微的停顿步态模式改变。关于背部和脖子的弯曲程度以及点头,AWS 生成 AI 创新中心的专家已决定在牛身上标记仅七个背部点一个在头部,一个在颈根部,五个在背部即可实现有效识别。由于现在我们已拥有了识别框架,也应该能够识别不稳定的步态模式。
接下来,我们使用数