Download presentation
Presentation is loading. Please wait.
Published by笺 夏 Modified over 8 years ago
1
航运大数据的实时挖掘
2
目录 航运业互联网化趋势与大数据需求 船讯网的数据支持 船讯网的数据挖掘尝试 未来的挖掘方向
3
航运业互联网化趋势与大数据需求 全球航运持续低迷 波罗的海干散货运价指 数呈现持续下跌趋势 中国出口集装箱价格综 合指数继续走低 全球航运市场 2015 年前 景堪忧!
4
航运业互联网化趋势与大数据需求 船公司电商平台 泛亚订舱平台(中远) 一海通(阿里和中海) 海运订舱网(中外运) 第三方电商平台 宁波航运订舱平台 快船租船平台(船讯网) 快舱网(内贸订舱平台) ValueFix (散杂货租船平台) 海运社交网站 ShippingRen 海运圈(船讯网) 互联网、电子商务、云服务、大数据等新技术应用带动了航运 信息化的快速发展。传统的信息传播渠道正在发生变革。 海运信息服务网站 船讯网(船舶位置服务) 中国船期网(船期查询服务) i 跟踪(集装箱物流跟踪服务) 一达通(进出口流程外包服务)
5
航运业互联网化趋势与大数据需求 航运大数据平台的优势(与经济数据发布的传统渠道比较) 传统渠道:克拉克森、德鲁里、 Genscape 、劳氏船级社、波罗的海航交所等 随着互联网化的不断深入,航运电商的蓬勃发展,大数据在航运业中的 运用越来越广,其作用越发突出。 如:港口集装箱吞吐量的估算方法 如:钢铁、煤炭等大宗商品流通环节 如:全球各货种船舶运力分布 不及时 不透明 小样本 传统渠道 不及时 不透明 小样本 大数据平台 实时计算 开放平台 全样本数据
6
船讯网的数据支持 船讯网的各种数据库 船舶档案资料 船舶位置数据 港口泊位资料 全球航线数据 集装箱班轮船期表
7
船讯网的数据支持 船舶档案资料 全球所有船舶的档案资料 来源于 IMO 编号颁发机构 IHS Fairplay 12 万多条(运营、在建、拆除等状态) 包含船舶类型、船龄、大小、国籍、经 营人、所有人等 200 多项数据资料
8
船讯网的数据支持 船舶位置数据 全球 12 万艘船舶实时动态 岸基 AIS (覆盖全球 80% 以上港口) 卫星 AIS (最快 20 分钟更新船位) 2008 年至今的全球船位轨迹数据
9
船讯网的数据支持 AIS 覆盖全球 92.88% 的 1000 吨位以上的船舶 AIS 覆盖内贸 97.48% 的 500 吨位以上的船位
10
船讯网的数据支持 港口泊位资料 全球 2000 多个港口 港口地理范围 锚地范围 港口属性 泊位(位置、长度、设施配 备) 泊位货物属性(集装箱、油 品、化学品、矿石、煤炭、粮 食等) 仍在持续完善中 已覆盖全球 98% 的吞吐 量在 10 万 TEU 以上的集 装箱港口
11
船讯网的数据支持 全球航线数据 全球集装箱港口间的航线 港口间的两两距离 仍然在不断完善中 集装箱班轮船期表 内贸船期表 ( 快舱网 ) 外贸船期表( EDI )
12
船讯网的数据挖掘尝试 船讯网数据特点:多个维度 过去、现在、未来(预测) 时间维度 船舶位置、港口范围、锚地范围、 码头位置、航线 空间维度 船舶类型、船舶大小、吨位、船 龄、国籍、所有人等 船舶属性 港口属性 泊位属性(长度、设施配备、装卸 货物类型) 港口泊位属性 船讯网数据挖掘的思路:多个维度综合考虑
13
船讯网的数据挖掘尝试 案例一 集装箱港口吞吐量估算 全球船舶历史轨迹数据库 船舶档案数据库(船舶类型、船长、 船宽、积载结构等属性) 港口泊位数据库(泊位岸吊长宽、安 全间距、移动速度、吊臂移动速度 等) 港口公开的集装箱历史吞吐量数据 (用于建模时验证结果) 数据源 港口:香港、新加波 时间: 2011 年全年(按月统计) 研究对象
14
船讯网的数据挖掘尝试 案例一 集装箱港口吞吐量估算 建模思路 步骤 1 确定靠泊船舶、靠泊位置、靠泊时长 数据:船舶历史轨迹数据 方法 1 :滑动窗口方法( sliding-window ) 长度自适应的滑动窗口方法,确定停泊事件和船舶 方法 2 :基于密度的聚类算法( DBSCAN ) 排除锚泊事件 A 和 C (去噪),确定靠泊事件 B
15
船讯网的数据挖掘尝试 案例一 集装箱港口吞吐量估算 建模思路 步骤 2 靠泊事件的集装箱吞吐量的计算 方案 1 :初略估算法( Baseline Method) 船舶总 TEU 为装卸量,即认为全装全卸 方案 2 :靠泊时长估算法 ( Berthing Time Based ) 装卸量 = 船舶总 TEU*X% (本次靠泊时间 / 历史最长靠泊时间) 认为该船舶每次的装卸效率都相同 方案 3 :建立精确的港口集装箱作业模型,估算吞吐量
16
船讯网的数据挖掘尝试 案例一 集装箱港口吞吐量估算 建模思路 步骤 2 之方案 3 港口集装箱作业模型 第1步骤:估算同时作业的岸吊数量和岸吊工作效率估计 ( 1 )船舶有效积载部分的长度、岸吊安全间距, 估算同时作业的码头岸吊数量 ( 2 )船舶宽度、岸吊内部参数,估算单个岸吊的工作效率 吊臂上小车单次运行距离、小车速度,单次抓起作业时间 第2步骤:靠泊事件吞吐量估计 ( 1 )集装箱排数 = 船舶有效积载部分长度 / 标准箱长度 ( 2 )非作业时间 = 岸吊移动到某排集装箱位置时间 + 放下吊臂时间(开始本排作业) + 收起吊臂时间(完成本排作业) ( 3 )作业时间 = 靠泊时间 - 非作业时间 ( 4 )本次靠泊事件吞吐量 = 作业时间 * 岸吊工作效率 * 岸吊数
17
船讯网的数据挖掘尝试 案例一 集装箱港口吞吐量估算 模型效果
18
船讯网的数据挖掘尝试 案例一 集装箱港口吞吐量估算 本项目与浙江大学计算机系合作,成果发表于普适计 算国际会议 UbiComp 2014 结论:通过船舶历史轨迹数据库、船舶档案数据库 和港口泊位数据库,建立的集装箱港口吞吐量估算 模型,达到了非常好的估算效果(年误差在 <2% )。 理论上讲,通过此模型能够每日实时地估算全球各 集装箱港口的日吞吐量。 结论:通过船舶历史轨迹数据库、船舶档案数据库 和港口泊位数据库,建立的集装箱港口吞吐量估算 模型,达到了非常好的估算效果(年误差在 <2% )。 理论上讲,通过此模型能够每日实时地估算全球各 集装箱港口的日吞吐量。
19
船讯网的数据挖掘尝试 全球船舶历史轨迹数据库 港口泊位数据库(港口范围、锚地范围、煤炭泊位) 动力煤期货收盘价 ( 活跃合约 ) :郑州商品交易所(用 于建模时验证结果) 环渤海动力煤 (Q5500K) 平均价格周指数:海运煤炭网 数据源 港口:秦皇岛 时间: 2013 、 2014 年 2 年(按日统计) 研究对象 秦皇岛港作为国内下水煤炭输出重要港口, 运煤船舶作业情况是分析国内国内煤炭海运 运价与动力煤价格行情走势的重要窗口。 案例二 在分析国内煤炭海运运价与动力煤价格行情走势中的应用
20
船讯网的数据挖掘尝试 步骤 1 确定全国内贸的所有运煤船舶 数据:船舶历史轨迹数据 国内港口煤炭泊位数据库(泊位范围) 运煤船:历史上靠泊过国内煤炭泊位的船舶 步骤 2 按日统计运煤船在秦皇岛港锚泊和靠 泊情况 数据:船舶历史轨迹数据 秦皇岛港口数据(锚地范围、煤炭泊位范 围) 锚地船:每日进入锚地并锚泊的运煤船数量 靠泊船:每日靠泊(煤炭泊位)的运煤船,以及其 靠泊时长 泊位利用率=每日靠泊船数量/总泊位数 压港率=锚地船/总船舶数 案例二 在分析国内煤炭海运运价与动力煤价格行情走势中的应用
21
船讯网的数据挖掘尝试
27
对于分析和判断上海航运交易所推出的航运运价衍生品中国沿海煤炭运力秦沪 航线煤炭运力合约价格走势,秦皇岛港拉煤船舶数量及靠离码头作业情况,同样 极具价值。 结论:通过每日实时统计秦皇岛港运煤船数量及分析靠离码头的作业情况,可 以判断国内环渤海动力煤价格走势,涨跌情况基本上与每轮环渤海动力煤价格涨 跌走势一致,并且具备一定的领先性(大约领先一到一个半月)。 另外,通过每日观察秦皇岛港运煤船数量,总体上也能提前预测出郑州商品交 易所动力煤期货价格每日的多空氛围(大约领先半个月),特别是在行情的总要 转折关口。 案例二 在分析国内煤炭海运运价与动力煤价格行情走势中的应用 航运数据挖掘在类似金融投资、现货行情分析领域的应用前景极其广阔。
28
未来的挖掘方向 压港分析及预警 吞吐量及运营效率 班轮航线及运力 大宗货物流量流向 全球运力变化......
29
Thank You ! 丁必为 | 技术总监 biwei.ding@shipfinder.com
Similar presentations
© 2025 SlidePlayer.com Inc.
All rights reserved.