随着人工智能技术的飞速发展,越来越多的行业开始受益于其强大的功能。在养老服务领域,AI技术的应用为老年人的生活带来了极大的便利。其中,“智慧点餐”这一创新应用,正是AI技术在养老服务中的一个生动体现。阿里云天池大赛推出了“赛道一:智慧养老—助老年群体智慧点餐”这一赛题,吸引了众多参赛者和关注者的目光。借助Datawhale平台提供的学习课程,进行了解和学习。
赛题:ELE AI算法大赛“赛道一:智慧养老—助老年群体智慧点餐”_创新应用大赛_天池大赛-阿里云天池的赛制
算力平台:账号登录-火山引擎
云服务平台:魔搭社区
Baseline流程简述:
函数名作用说明main_process主流程函数,负责整体调度和流程控制,是理解全局的关键。process_audio_with_asr音频转文本(ASR),决定了输入数据的文本质量。process_texts_with_llm批量调用大模型,完成意图识别和商品抽取,是核心处理环节。generate_test_asr_texts生成测试用ASR文本,辅助测试和评估。generate_test_llm_results生成测试用LLM结果,辅助测试和评估。format_and_save_results结果整理与保存,保证输出规范和可追溯。关键函数说明
ASR音频处理模块:
def process_audio_with_asr(model: AutoModel, audio_files: List[str]) -> List[str]:
"""
使用ASR模型处理音频文件
参数:
model: ASR模型
audio_files: 音频文件路径列表
返回:
List[str]: 识别的文本列表
"""
logger.info(f"正在处理 {len(audio_files)} 个音频文件...")
# 运行ASR模型
res = model.generate(
input=audio_files,
cache={},
language="auto", # 自动检测语言
use_itn=True, # 使用逆文本规范化
batch_size_s=60,
merge_vad=True,
merge_length_s=15,
output_dir=CONFIG["output_dir"]
)
# 提取识别文本
asr_texts = []
tag_to_split = "<|withitn|>"
for item in res:
full_text = item.get('text', '')
if tag_to_split in full_text:
parts = full_text.split(tag_to_split, 1) # 分割一次
if len(parts) > 1:
extracted_text = parts[1].strip()
asr_texts.append(extracted_text)
logger.info(f"ASR处理完成,提取了 {len(asr_texts)} 条文本")
return asr_texts
deepseek领域分类:
def process_audio_with_asr(model: AutoModel, audio_files: List[str]) -> List[str]:
"""
使用ASR模型处理音频文件
参数:
model: ASR模型
audio_files: 音频文件路径列表
返回:
List[str]: 识别的文本列表
"""
logger.info(f"正在处理 {len(audio_files)} 个音频文件...")
# 运行ASR模型
res = model.generate(
input=audio_files,
cache={},
language="auto", # 自动检测语言
use_itn=True, # 使用逆文本规范化
batch_size_s=60,
merge_vad=True,
merge_length_s=15,
output_dir=CONFIG["output_dir"]
)
# 提取识别文本
asr_texts = []
tag_to_split = "<|withitn|>"
for item in res:
full_text = item.get('text', '')
if tag_to_split in full_text:
parts = full_text.split(tag_to_split, 1) # 分割一次
if len(parts) > 1:
extracted_text = parts[1].strip()
asr_texts.append(extracted_text)
logger.info(f"ASR处理完成,提取了 {len(asr_texts)} 条文本")
return asr_texts
实验结果:
2025/04/29 0.7228
感谢Datawhale平台教程,由浅入深,循序渐进,初步掌握饿了么赛题的解答流程。