会议室白板内容文字提取数据集

会议室白板内容文字提取数据集

V1.0
最新更新:2026-02-20 11:22:49
样本数:500
文件大小:1.4G
文件格式:JPG
数据领域:图片
持有人:墨比乌斯公司
行业范围:白板文字识别,会议内容提取,智能办公数据集,OCR数据集
适用方向:文字识别,会议服务,内容管理,智能办公
数据集介绍

随着智能办公的普及,会议室白板上的信息数字化需求日益增加。然而,现有技术在处理白板图片时面临挑战,特别是由于不同书写方式、字体和光照条件的影响,导致现有OCR方案识别准确率较低,交互性不足。本数据集致力于解决白板文字识别中的精度提升问题,帮助实现会议内容的自动化记录与管理。数据采集通过专业设备在不同光照和书写条件下拍摄白板图片,确保多样性和代表性;几轮严格的标注和审核制度,以及专业图像处理团队的参与,确保数据质量与一致性;数据预处理采用噪声过滤、图像增强等技术,保证输入数据的高质量。数据以JPG格式存储,并以清晰的目录结构进行组织。

示例样本展示
图片文件名分辨率文本内容书写风格文字语言字体大小估计颜色分布图形存在文字对齐背景清晰度文字密度
6bb2ebc4a25567c6c3315737247e7025.jpg2560*1920SSP245: [same with SSP585] - map projection: 3-figure LM, obs + sim (6 figures in one panel) 10th, obs + sim (6 figures) one panel 90th, obs + sim (6 figures) one panel - time series 1-figure [can combine trends] LM, obs + sim, with error bar (1 figure) 10th, ... (1 figure) 90th, ... (1 figure) - pointrange (point with error bar) 2-figure one-sample, each contain 1 scaling factor, each sf contain occ&comens. two-sample... - barplot 1-figure attributable change [3 figure] 10th + LM + 90th, sprues each contain: obs, all, ghg, nat. aer.手写英语中等主要为黑色,部分红色存在图形左对齐清晰中等
50e1a3f21f27e0fee44e4b7ddcd32857.jpg1920*1440Attribution in Optimal Fingerprinting Dataset: OCCL, CMEMS, CESM2, CTL method TLS trend estimates of above two datasets Global OF Regional OF method - c2 methods single, two-sample main figure global bot clearly the messages SA TS MS MP IF summary OBS attribution 1-, 2-, 3- signals 1-, 2-, 3- signals 9th quantile botht Quantile 90th quantile both 1*30 0.2 obs (feb) TLS EXAMPLES: 1. Maps obs + S 2. time series sim global MP CM3 TS MS reg CMS IP TT Boxplots, etc.手写英语中等黑色和红色文字分布存在左对齐清晰中等密集
b3cd1e37bb2548682c96d90761bde58f.jpg1920*1440dynamic improve uncertainty statistical matrix fitted with OC classes trend/CTL concentration R² RMSE spearmen pearson optical average CHL trends CHL class手写英语中等主要为黑色存在多个图形和表格不规则,没有特定对齐方式背景清晰,有少量反光
数据结构总览
字段类型描述
文件名string文件名
分辨率string分辨率
文本内容string白板上书写的完整文本内容。
书写风格string白板上文字的书写风格类型,例如手写或打印体。
文字语言string白板上的文字所使用的语言。
字体大小估计string白板文字的大概字体大小。
颜色分布string白板上不同颜色文字的分布情况。
图形存在boolean白板上是否存在图形(例如方程图、流程图等)。
文字对齐string白板上文字的对齐方式,例如左对齐、右对齐或居中。
背景清晰度string白板背景的清晰度,是否有反光或阴影影响识别。
文字密度string白板上文字的密集程度。
授权与合规说明
项目内容
授权类型CC-BY-NC-SA 4.0(非商业署名共享)
商业使用需申请专属订阅或授权合同(支持按月/按调用次数收费)
隐私与脱敏无PII,无真实公司名,模拟场景均符合行业标准
合规体系中国《数据安全法》 / 欧盟GDPR / 企业数据可访问日志支持

找不到您要找的数据?

让数据提供商通过发布请求来找到你

发布您的请求