金融界2024年12月9日消息,国家知识产权局信息显示,中移(杭州)信息技术有限公司申请一项名为“神经网络轻量化方法、装置、设备、介质及产品”的专利,公开号 CN 119089962 A,申请日期为 2024年8月。
专利摘要显示,本发明提供一种神经网络轻量化方法、装置、设备、介质及产品,方法包括:确定转移难度系数的第一预设取值区间、量化裁剪范围的第二预设取值区间和量化位宽的第三预设取值区间;基于第一预设取值区间、第二预设取值区间和第三预设取值区间,构建搜索空间;在搜索空间中,确定各网络层的最优参数组合;基于各网络层的最优参数组合,对待量化模型进行逐层量化得到量化后的模型本发明提供的神经网络轻量化方法综合考虑多种因素来构建搜索空间,使轻量化方法更加普适,适用于不同类型的网络结构,也能保证量化后模型可以保持精度,进一步选择各网络层的最优参数组合来实现模型轻量化,可以在保持精度的前提下,减少计算资源消耗并加快处理速度。