大模型LLM表格报表分析:markitdown文件转markdown,大模型markdown统计分析

发布于:2025-04-13 ⋅ 阅读:(34) ⋅ 点赞:(0)

整体流程:用markitdown工具文件转markdown,然后大模型markdown统计分析

markitdown

https://github.com/microsoft/markitdown

在线体验:https://huggingface.co/spaces/AlirezaF138/Markitdown

安装:

pip install markitdown[xlsx]

代码:

from markitdown import MarkItDown

## 转换文件成markdown格式
md = MarkItDown(enable_plugins=False) # Set to True to enable plugins
result = md.convert(r"C:\Users\loong\Downloads\BetterYeah母婴小店销售数据.xlsx")
print(result.text_content)

文件:
在这里插入图片描述
结果:
在这里插入图片描述

2、大模型markdown统计分析

from openai import OpenAI
from markitdown import MarkItDown

## 转换文件成markdown格式
md = MarkItDown(enable_plugins=False) # Set to True to enable plugins
result = md.convert(r"C:\Users\loong\Downloads\BetterYeah母婴小店销售数据.xlsx")
print(result.text_content)

## 模型总结
llm_model = "qwen-plus"
client = OpenAI(base_url="https://dashscope.aliyuncs.com/compatible-mode/v1", api_key="sk***")

def send_messages(messages):
    response = client.chat.completions.create(
        model=llm_model,
        messages=messages,
        stream=False
    )
    return response.choices[0].message.content


system_prompt = f"""
            根据下面数据,进行整体表格统计分析
            
            ====
            数据为:{result.text_content}
            """
messages = [{"role": "user", "content":system_prompt }]
results = send_messages(messages)
print("results:",results)

下面是运行结果:

表格统计分析

以下是对给定数据的全面统计分析,涵盖销售数量和销 售额两个维度,并按平台、产品类型和日期进行细分。


1. 总体销售情况
  • 总销售数量:2076 件
  • 总销售额:49,359 元

2. 按平台分类统计
平台 销售数量(件) 销售额(元)
淘宝 1028 24,510
抖音 1048 24,849
  • 结论
    • 抖音和淘宝的销售数量接近,但抖音的销售额略高 于淘宝。
    • 抖音可能更注重高单价产品的推广。

3. 按产品分类统计
产品 销售数量(件) 销售额( 元)
康宝婴儿奶粉(S-26) 497 15,240
宝宝乐婴儿车 503 15,583
帮宝适纸尿裤 1076 18,536
  • 结论
    • 帮宝适纸尿裤销量最高,且销售额也最高,说明市 场需求较大。
    • 宝宝乐婴儿车的单价较高,因此销售额与销量接近 。

4. 按日期分类统计
日期 销售数量(件) 销售额(元)
2023-12-26 302 6690
2023-12-27 337 6901
2023-12-28 350 7403
2023-12-29 426 7497
2023-12-30 371 7271
2023-12-31 345 7266
2024-01-01 345 7431
  • 结论
    • 2023-12-29 的销售数量和销售额均为最高,可能是促销活动或节假日效应导致。
    • 整体趋势显示,销售额随时间略有波动,但整体保 持稳定。

5. 按平台和产品交叉统计
淘宝
产品 销售数量(件) 销售额( 元)
康宝婴儿奶粉(S-26) 240 7295
宝宝乐婴儿车 211 7178
帮宝适纸尿裤 577 10,037
抖音
产品 销售数量(件) 销售额( 元)
康宝婴儿奶粉(S-26) 257 7945
宝宝乐婴儿车 292 8405
帮宝适纸尿裤 499 8501
  • 结论
    • 在淘宝上,帮宝适纸尿裤的销量和销售额均最高。
    • 在抖音上,康宝婴儿奶粉和宝宝乐婴儿车的销量较 好,但帮宝适纸尿裤的销售额仍占主导地位。

6. 平均单价分析
产品 平均单价(元/件)
康宝婴儿奶粉(S-26) 30.66
宝宝乐婴儿车 31.00
帮宝适纸尿裤 17.22
  • 结论
    • 宝宝乐婴儿车的平均单价最高,其次是康宝婴儿奶 粉。
    • 帮宝适纸尿裤虽然销量最高,但平均单价较低。

7. 热门产品分析

根据销量和销售额综合评估,热门产品为:

  1. 帮宝适纸尿裤:销量和销售额均最高,市场接受度广。
  2. 康宝婴儿奶粉(S-26):在抖音上的表现尤为突出。
  3. 宝宝乐婴儿车:单价较高,适合高端用户群体。

8. 改进建议
  1. 优化库存管理

    • 针对帮宝适纸尿裤的高需求,建议增加库存以避免断货。
  2. 平台差异化营销

    • 淘宝可以继续主打帮宝适纸尿裤,而抖音可以加强康宝婴儿奶粉和宝宝乐婴儿车的推广。
  3. 节日促销活动

    • 结合节假日推出优惠活动,如满减、赠品等,进一步提升销量。
  4. 数据分析支持

    • 定期进行类似统计分析,及时调整策略以适应市场需求变化。

通过以上分析,可以看出不同平台和产品之间的销售差 异,以及潜在的增长机会。希望这些数据能为企业制定 更有效的营销策略提供参考。


网站公告

今日签到

点亮在社区的每一天
去签到