为了保证制作简历的安全性和流畅性,建议您使用Chrome浏览器进行访问
多模态算法实习生
200-250/天
多模态算法实习生 200-250/天
北京
本科
5天/周
4个月
发布于 4月23日
职位描述
PythonTensorFlowPyTorch数据分析人工智能
项目:支持毛笔字识别与字体渲染优化 工作地点:北京/苏州/南京 岗位职责: 1. 参与毛笔字识别与字体渲染优化项目,协助开展多模态大模型微调与传统 OCR 模型两个技术方向的算法研究与开发工作。 2. 针对包含毛笔字的图片数据,进行预处理,包括但不限于对存在遮挡、角度倾斜(X、Y、Z 轴方向)、模糊等问题的毛笔字图片进行分析,提取有效特征。 3. 在多模态大模型微调方向,协助进行模型训练数据的准备,如对毛笔字图片及其对应的文本标签进行整理、标注和清洗;参与模型的训练、验证和调优过程,观察模型在毛笔字识别、区域定位、角度矫正、去遮挡及渲染优化等任务上的表现,并协助分析实验结果,提出改进方案。 4. 在传统 OCR 模型方向,研究适用于毛笔字的预处理算法,如图像增强、倾斜校正等,以改善毛笔字的识别效果;参与传统 OCR 模型的特征提取、字符分割、识别分类等模块的设计与优化,提升对复杂毛笔字图像的识别准确率。 5. 协助实现毛笔字的角度矫正、去除遮挡物、美化渲染及解决模糊问题的算法,通过编码实现相关功能,并进行调试和测试。 6. 跟踪行业内最新的技术动态和研究成果,为项目提供新的思路和方法;撰写项目相关的技术文档和报告,记录算法设计、实验过程和结果。 任职条件 (一)必备条件 1. 本科及以上学历,计算机视觉、机器学习、人工智能、图像处理等相关专业,在读学生(本科三年级及以上、硕士研究生)。 2. 熟悉 Python 编程语言,具备一定的编程能力,能够熟练使用常见的机器学习和图像处理库,如 PyTorch/TensorFlow、OpenCV、Pillow 等。 3. 掌握机器学习的基本理论和方法,了解深度学习模型(如 CNN、Transformer 等)的原理和应用,对多模态学习和 OCR 技术有一定的认识。 4. 具备良好的数据分析和问题解决能力,能够对实验数据进行分析和总结,提出合理的解决方案。 5. 工作认真负责,具有良好的团队合作精神和沟通能力,能够积极参与团队讨论和协作。 6. 对毛笔字识别、传统文化与技术结合有浓厚的兴趣,愿意深入研究相关技术问题。 (二)优先条件 1. 有计算机视觉、OCR、多模态模型训练等相关项目经验者优先,熟悉毛笔字识别或字体渲染相关技术者更佳。 2. 熟悉多模态大模型(如 CLIP、ViLT 等)的训练和微调流程,或对传统 OCR 模型(如 CRNN、CTPN 等)有实际应用经验者优先。 3. 具备良好的数学基础,熟悉线性代数、概率论与数理统计等知识,对算法优化有一定了解者优先。 4. 有书法基础或对毛笔字文化有一定了解者优先,能够更好地理解毛笔字的特点和需求。 5. 具有较强的学习能力和自我驱动力,能够快速掌握新的技术和工具,适应项目的需求变化。 岗位亮点 1. 参与前沿技术项目:接触多模态大模型和传统 OCR 技术在毛笔字处理领域的实际应用,深入了解计算机视觉与传统文化结合的创新方向。 2. 丰富的学习资源:团队成员具备深厚的技术背景和行业经验,能够提供专业的指导和培训,帮助实习生快速成长。 3. 实际应用价值:项目成果有望应用于实际产品中,为毛笔字的数字化处理和传承提供技术支持,具有重要的实际意义和社会价值。 4. 灵活的工作环境:提供舒适的办公环境和良好的团队氛围,鼓励创新和交流,支持实习生在项目中发挥自己的想法和才能。
工作地址
北京市/北京市/东城区 环球贸易中心E座
相似职位推荐
使用微信扫码登录