技术专家dataiku
大规模机器学习的快速实验和可操作化。
不依赖存储和计算
dataiku はAmazon Web Services (AWS)、Google Cloud Platform (GCP)、Microsoft Azure でサポートされているのインスタンスを使用しオンプレミスやクラウドで実行可能です。每个云的存储和各种各样的计算层。。
支持所有IDE和Git
dataiku可以透明访问数据源,无需管理连接问题,并提供Python、R、Julia和Scala的集成开发环境。。dataiku的应用方法是
- “Notebook”风格(Jupyter Notebook)
- 使用“Visual Flow”样式(生成图形显示在工具上的计算流程)
- 将自己的IDE (SublimeText, Visual Studio)连接到平台上
所有的开发都可以用Git管理。。
使用dataiku插件的强大扩展
有了dataiku插件,开发人员可以使用Python和Java建立强大的扩展功能,可以控制和扩展平台的所有部分。。dataiku プラグインは dataiku 内での新しいデータ・ソースへの接続、非プログラマーのための新しいアルゴリズムの視覚提供およびカプセル化、ITプロセスの統合などを支援します。dataiku可以通过API进一步扩展,并与Jira和Jenkins集成。。
构建端到端的坚固数据架构
dataiku アーキテクチャは、既存技術への計算のプッシュダウンを体系化するパターンを中心に構築され、データアーキテクトが自身の堅牢なデータアーキテクチャを構築できるすべてのビルディングブロックを提供します。
- 保护架构不受基础数据源改变的数据变变器。
- 批量数据管道和实时模型评分都可以通过自动比例、版本控制和回滚来实现鲁棒。。
- 用于有效增量数据重新计算的智能数据重构引擎。
查看dataiku的MLOps功能
建立成千上万的模型,找到最好的模型
利用dataiku AutoML,自动测试多种算法和参数,快速创建同类最高模型。。或者完全可以管理所有的训练设置、算法设置和优化过程,包括创建自己的定制模型和使用高级深度学习模型。。
dataiku支持四个最常用的机器学习引擎:Python, spark, H2O, TensorFlow。。 十大网赌网址登陆有超过32种核心算法。。
用API进行自动化监控
dataiku提供广泛的API用于建立、管理和部署平台(包括完整的解决方案和自动化部署新服务)。十大网赌网址登陆可以将dataiku集成到现有的监控IT堆栈中。。