Railinc成立于1999年,为美国铁路协会(AAR)提供IT服务,是铁路行业最具创新性和最可靠的IT与信息服务提供商。作为AAR的全资子公司,Railinc支持业务流程并提供商业情报,帮助货运铁路行业提高生产率、运营效率和投资回报率。

近年来,铁路公司已经认识到了大数据带来的机遇。为了满足可操作数据的迫切需求,我们与一级、短线和区域铁路公司及其他Railinc客户积极合作,在铁路网络中的不同位置捕获大量数据,并帮助客户:
跟踪整个北美货运铁路网络的货运情况
提高铁路维修、租车及其他方面的铁路运营效率
监控设备的工况,确保货物的安全运输
更好地管理铁路交通流量,以保持铁路车辆的顺畅行驶
Railinc现已成为给北美铁路系统实时提供准确的铁轨间数据的最大提供商。这些数据正在帮助我们的客户提高效率、管理成本、并逐步完善北美铁路网络。
为了继续满足客户的数据需求,我们开始拥抱大数据,并将之前的专有数据仓库替换为开源环境,以较低的成本提供更大的灵活性。两年前,我们开始迁移到Hortonworks Hadoop,将其作为框架来存储、处理和管理我们当今需要面对的海量数据,并在未来支持更多的数据。
Control-M是我们大数据战略的重要组成部分。11年以来,Railinc一直在使用Control-M调度和监控跨越多个平台和应用的复杂批处理流程。Control-M for Hadoop允许我们在不更换现有界面的情况下开发、调度并监控Hadoop批处理流程。
大数据带来前所未有的可视性
随着铁路系统逐渐开始采用先进技术,例如在轨道旁安装智能传感器,北美铁路网变得越来越智能化。这些传感器能够提供位置和移动信息等数据,从而帮助客户管理车队、跟踪设备、查看ETA、有效地协调数以百万计的铁路车辆的运行、并将交货时间缩短到以小时为单位。此外,铁路系统还部署了其他检测器,用于监控车辆的物理状况,令铁路公司和车主能够一目了然地检测到诸如刹车失灵或轮胎漏气等问题。这些数据令Railinc能够提前发出警告,以便及时安排维修小缺陷,防止其演变成需要高昂维修费的严重问题。
这些数据数量惊人 — 我们从绵延14万英里的轨道上捕获超过4万台机车和160万辆轨道车的数据,而这些数据又源自于1,700家不同轨道车提供商安装的设备、以及超过560条本地和区域铁路与7条一级铁路。我们的数据仓库中已经存储了50TB不同来源的数据,预计这一数据量在未来几年还将增长近一倍。
Railinc的铁路应用可利用这些数据来帮助客户提高运营效率并降低运营成本。我们的租车应用支持客户改进与铁路设施使用相关的收付款活动,从而提高这些设施的利用率和付款准确性。Clear Path™ System等交通流量管理应用能帮助列车顺利穿越北美最繁忙的铁路关卡“芝加哥机场站”。
Control-M帮助确保大数据始终顺畅传输
为了支持我们的铁路行业应用,我们必须每天从许多来源收集大量数据,并通过多种系统来分析和转换这些数据,令其成为可操作的信息,同时生成报告并将其分发给客户。及时将这些数据传输到适当位置所涉及到的工作流极为复杂,涵盖为数众多的依赖关系。
这就是Control-M的用武之地。即便是面对最复杂的工作负载,Control-M也能简化工作流创建流程。它的图形界面允许用户逐一绘制出各项作业之间的依赖关系,从而确保按部就班地启动各个流程。
这种模式的最大裨益也许就是能够避免解决方案的技术绑定问题。当大数据团队添加Hadoop时,Control-M可与之轻松互操作,令我们能像对待其他平台一样轻松查看并控制Hadoop作业。调度人员不必为了操控Hadoop而去学习如何使用特殊的调度工具,而是能够使用相同界面来调度所有平台上的工作负载,并且能够全面了解每天晚间运行的数百个作业。
Control-M Batch Impact Manager允许我们监控Hadoop作业,但无需工作人员全天候守护在控制台前。如果解决方案检测到潜在的延迟或失败,将会立即提醒我们。客户依靠我们来履责这些SLA。例如,芝加哥机场站的报告延迟不仅会影响芝加哥地区的铁路运营,而且还会对整个北美地区的铁路运营产生影响。Batch Impact Manager允许我们通过智能的主动式方法来保持流程和列车的顺畅运行。
Control-M的另外一个优点是它支持多站点环境。大数据环境的性质决定了为灾难恢复而构建备用站点的重要性。因此,我们针对Hadoop环境同时创建了主用站点和备用站点。
但是,我们并未将备用站点局限于只能开展灾难恢复活动。我们需要能在任何一个站点上开展任何工作的灵活性。Control-M可同时与两个站点轻松交谈,令我们能对每一个站点实施ETL、操控数据、创建视图、并根据需要在站点之间来回切换流程,最终能在两个站点上复制IT服务和数据。在未来,这种多站点功能将有助于实现负载均衡,助力我们满足日益增长的大数据报告需求。
结论
过渡到Hadoop导致作业量大增,而Hadoop工作流目前仅占到我们所有批处理流程的1/3。Control-M的编排功能允许我们及时将数据传输到适当位置,对于我们成功操控大数据起到了至关重要的作用。
如果没有Control-M,我们将根本无法完成这项工作。
Robert Redd
作为一名产品发布管理工程师,Robert Redd负责管理系统,以确保Railinc应用正常为客户服务,并支持公司开发人员为货运铁路行业创建新型解决方案。Redd于2000年加入Railinc,毕业于美国军事学院,是一名美国老兵。




