大数据资源导航
企业展台
- ParAccel ParAccel向美国执法机构提供数据分析,对有犯罪前科的人进行跟踪向执法机构提供了参考性较高的犯罪预测
- Cloudera 专业的大数据系统服务商,基于Hadoop开源技术体系的定制产品分发
- HP BigData HP’s big data solutions
- 魔镜 魔镜,大数据分析工具,商业智能,数据挖掘,数据可视化分析软件
- Platfora Platfora声称拥有了第一个基于Hadoop的可向外扩展的内存大数据分析平台,简化了Hadoop与大数据分析之间的复杂过程
- DeepMind DeepMind
- Microsoft BigData Microsoft’s big data solutions
- 美林数据 国内大数据技术和服务提供商
- Amazon BigData 专注于大数据BI,大数据分析,大数据挖掘工具等领域
- 九次方 秉承“贡献中国数据智慧,释放全球数据价值”的发展理念,致力于推动政府数据公开及数据交易,挖掘各个产业的大数据价值及大数据应用
- 格灵深瞳 计算机视觉大数据分析服务商
- Mixpanel Mixpanel主要做web和移动分析,其提供的服务可以分析监测用户活动
- MapR MapR is the Leader in Apache Hadoop Technology for Big Data Deployments
- Kaggle Kaggle希望通过“数据科学运动”来挑战世界上最好的科研人员和统计学家
- deepsense.ai Build your AI solutions the right way
- Netflix (Nasdaq NFLX)是一家在线影片租赁提供商,用大数据经验制作了《纸牌屋》
- Aleiye Aleiye是企业交付式大数据开放平台。采用独立部署的方式安装在企业内部,同时,能够使用多种接入手段将企业内部所有结构化和非结构化数据进行整合
- Informatica 老牌数据集成服务商,BI厂商
- Databricks Data Science made easy, from ingest to production. Powered by Apache Spark
- SPSS 传统的数据挖掘与统计分析BI服务商
- 华为大数据 华为企业云针对广告营销、电商、车联网等大数据应用场景打造了易使用、高可靠、低成本的大数据方案
- Concurrentinc 企业大数据应用平台公司,成立于2008年。该公司是流行的大数据应用开发工具Cascading的母公司。Cascading可简化基于Apache Hadoop 的大数据应用的开发、部署和管理
- IBM BigData The Big Data Hub | Understanding big data for the enterprise
- 永洪科技 永洪BI,大数据分析
- 星环科技 基于Hadoop的大数据分析优势,对庞大的数据量进行更快处理,集成超强的数据统计、分析与挖掘功能来支持商业决策
- nvidia AI nvidia deep learning ai
- Gooddata 主要面向商业用户和IT企业高管,提供数据存储、性能报告、数据分析等工具
- 国云数据 大数据技术和解决方案服务商
- 农业大数据应用 农业大数据应用云服务平台
- Datahero DataHero’s intuitive drag and drop interface makes data analysis easy for everyone.
- Teradata 啤酒与尿片故事是从Teradata的一位销售经理口中传出。
- SAS 传统的数据挖掘与统计分析服务商
- Salesforce 企业云计算服务独角兽企业,全球有 29,800 多家公司和 646,000 名注册用户正使用 Salesforce 的强大功能
- 神策分析 数据分析解决方案服务商
- Pivotal paas, platform as a service, big data, agile, mobile, oss
- 数据魔方 淘宝数据分析工具
- altiscale Big data as a service
- Palantir 大数据独角兽企业,FBI的御用大数据服务商
- Datameer Datameer is the only end-to-end big data analytics platform for Hadoop that empowers business users to directly integrate, analyze, and visualize any data
- MapD Database and Visual Analytics Platform
- Splunk 第一家上市的大数据概念公司。曾被华尔街评为:大数据里面的谷歌(Googlefor IT)。
- 数据堂 专注数据,共享价值,融合大数据资源,实现数据价值最大化,是一家专注于大数据的互联网公司
- Oracle Bigdata Oracle’s Big Data Solutions
- QlikTech QlikTech旗下的Qlikview是一个商业智能领域的自主服务工具
- Hortonworks 顶级Hadoop大数据服务商
- 明略数据 企业级大数据技术公司,专注于解决中国最重要的发展问题,提供最安全的定制化大数据解决方案
- 数人云 基于云计算的数据中心操作系统服务商
- SAP BigData SAP’s big data solutions
- Tableau 专业的数据可视化分析系统
- Wolfram 计算与知识同步,网站与公共资源
- Mu Sigma 印度大数据企业,通过对百货商店监管摄像头的数据进行分析,得出消费者的购买意图、倾向、满意度,服务超过50家世界五百强企业使用
- 百分点 专注于大数据与推荐引擎的互联网技术公司,是最大的第三方消费偏好数据平台,最权威的个性化推荐引擎技术平台
- Datastax DataStax powers the big data applications that transform business and profoundly improve customer experiences through Apache Cassandra
开源技术
- Redis Redis is an open-source, networked, in-memory, key-value data store with optional durability.
- Echarts 开源的ECharts来自百度EFE数据可视化团队
- Spark 大数据内存分析框架NO1
- R 最流行的数据统计分析工具和开发语言
- iCharts The leader in collaborative visual intelligence.
- Phoenix High performance relational database layer over HBase for low latency applications
- Tachyon Tachyon is an memory distributed file system. By storing the file-system contents in the main memory of all cluster nodes
- Impala The Apache-licensed Impala project brings scalable parallel database technology to Hadoop, enabling users to issue low-latency SQL queries to data stored in HDFS and Apache HBase without requiring data movement or transformation
- Python 数据可视化开发语言,大数据处理全栈式开发语言
- Drill Drill is the open source version of Google’s Dremel system which is available as an infrastructure service called Google BigQuery
- Cassandra 开源NOSQL数据库
- Mesos 未来的分布式操作系统内核
- Solr 基于Lucene技术的全文搜索系统
- D3 数据可视化javascript开源库
- Theano Python package for deep learning that can utilize NVIDIA’s CUDA toolkit to run on the GPU
- Rapidminer RapidMiner empowers enterprises to easily mashup data, create predictive models and operationalize predictive analytics within any business process
- Chukwa Large scale log aggregator, and analytics.
- tensorflow 谷歌深度学习开源系统
- Tajo A big data warehouse system on Hadoop
- Giraph Apache Giraph is an iterative graph processing system built for high scalability
- Kylin open source Distributed Analytics Engine designed to provide SQL interface and multi-dimensional analysis (OLAP) on Hadoop supporting extremely large datasets
- Graphx A Resilient Distributed Graph System on Spark
- HPCC massive parallel-processing computing platform for big data processing and analytics.
- Docker an open platform for developers and sysadmins to build, ship, and run distributed applications
- Pig Pig provides an engine for executing data flows in parallel on Hadoop
- MongDB 主流NOSQL数据库,适合文档和非结构化海量数据存储
- Hadoop 大数据开源系统NO.1
- Knime Open for Innovation data mining
- Storm Storm, distributed and fault-tolerant realtime computation
- Mahout 分布式数据挖掘模型算法库
- Flume 数据采集工具
- Dynamodb distributed key/value store, implementation of Dynamo
- Scikit-learn scikit-learn: machine learning in Python.
- Vespa 雅虎最新开源大数据处理系统
- Thrift A cross-language RPC framework for service creations. It’s the service base for Facebook technologies
- Flink high-performance runtime, and automatic program optimization
- S4 distributed stream computing platform
- DAWN DAWN is a five-year research project to democratize AI
- Keras 深度学习库
- Mxnet 深度学习库
- Gephi 数据可视化工具
- Hive Hadoop开源体系下的数据仓库,海量数据存储,离线分析
- Elasticsearch Search and analytics engine based on Apache Lucene
- Hbase Hadoop开源体系下的主流分布式数据库,列式数据存储,海量数据分布式存储
- Spanner globally distributed semi-relational database
- Tez Tez is a proposal to develop a generic application which can be used to process complex data-processing task DAGs and runs natively on Apache Hadoop YARN.
- Highcharts Interactive JavaScript charts for your webpage
- pytorch Tensors and Dynamic neural networks in Python
- Orange Open source data visualization and data analysis for novice and expert
- deep learning for java deep learning for java
- Weka Weka is a popular suite of machine learning software written in Java, developed at the University of Waikato, New Zealand
- Hypertable Database system inspired by publications on the design of Google’s BigTable. The project is based on experience of engineers who were solving large-scale data-intensive tasks for many years
大数据源
- Linkeddata Connect Distributed Data across the Web
- 乌云网 最权威的安全漏洞数据公开网站
- AWS公开数据集 AWS公开数据集
- 数据堂 融合大数据资源,实现数据价值,提供数据定制,数据商城,移动应用数据服务
- Data.gov of India open goverment data platform India
- Kdnuggets Datasets for Data Mining and Data Science
- 贵阳大数据交易所 贵阳大数据交易所
- 1000genomes A Deep Catalog of Human Genetic Variation
- 世界银行数据 世界银行公开数据 免费并公开获取世界各国的发展数据.
- AWS Datasets Public Data Sets on AWS provides a centralized repository of public data sets that can be seamlessly integrated into AWS cloud-based applications
- Data.gov of UK open goverment data platform UK
- Kaggle The home of data science
- 谷歌分析 谷歌搜索分析
- Data.gov of US The home of the U.S. Government’s open data
- Datahub The easy way to get, use and share data
- 最全大数据集下载列表 最全大数据源(集)下载列表(持续补充)
- Quandl Get the Data You Need In the Format You Want
- 贵阳大数据开放平台 贵阳大数据开放服务平台
- 数据圈 国内数据资源交易平台
- UCI数据集 机器学习UCI数据集
- 中国国家数据 中国统计局官方公开数据库数据
研究机构
- thegovlab 政府大数据治理研究
- DSI of Columbia University Data Science Institute of Columbia University
- NOAH'S ARK LAB Huawei NOAH’S ARK LAB From Big Data To Deep Knowledge
- MIT-CSAIL Big Data Initiative MIT-CSAIL
- Datavlab 交流数据可视化的一个平台,由淘宝可视化团队发起,意在为可视化的爱好者提供了解可视化,实践可视化,讨论可视化的渠道
- Baidu Research Baidu Research
- 南京大学机器学习研究所 南京大学机器学习与数据挖掘研究
- Berkeley Dlab Berkeley Intelligent research design for data intensive social science
- 中关村大数据产业联盟 根据大数据产业特点和大力发展技术与产业突破性创新的战略决策,由中关村管委会直接领导并成立于2012年12月13日
- Google Research Google Research
- ML of UofT Machine Learning at University of Toronto
- Geoffrey E. Hinton 深度学习大牛
- 大数据研究中心 电子科大大数据研究中心
- ISTC BigData Computer Science and Artificial Intelligence Laboratory (CSAIL) at MIT
- IBM AI Research IBM AI Research
- DeepMind DeepMind
- AMPLab Spark是发源于美国加州大学伯克利分校AMPLab的大数据处理平台
- openAI openAI联盟
- Stanford ML Group Stanford ML Group
- 城市计算 微软城市计算研究
- DataScienceCenter The online resource for big data practitioners
- AWS Machine Learning AWS Machine Learning
- Allen Institute for AI Allen Institute for AI
- Berkley AI Berkley AI
- 微软亚洲研究院 微软亚洲研究院
- Big Data University Analytics, Big Data, and Data Science Courses
- Columbia DSI Columbia University Data Science Institute
- Facebook Research Facebook Research
- Intel AI-academy Intel AI-academy
- Deeplearning deep learning research
- ESR ESRC Business and Local Goverment Data Research Centre
- Andrew Ng Andrew Ng’s research is on machine learning and AI, with an emphasis on deep learning.
- Bigdata University 大数据公开课第一站
- OpenAI OpenAI Union
- Stanford InfoLab 斯坦福信息研究实验室
研究专栏
- Oren Etzioni Oren Etzioni
- Sebastian Thrun Adjunct Professor — Stanford University
- Richard Socher Richard Socher
- 人大经济论坛 专业的计量经济学与统计学论坛
- 数据小兵 专注于业务数据分析领域,热衷SPSS推广和实践,致力开发SPSS教程及精品案例
- Fei-Fei Li Fei-Fei Li
- 腾讯大数据 腾讯大数据官网,数据报告,腾讯大数据技术框架,大数据学院,大数据开源,大数据应用
- andrew.ng andrewng研究团队
- mattturck VC at FirstMark
- marvin521 深度学习博客
- 知识图谱资源 知识图谱资源
- 中文开放知识图谱 中文开放知识图谱
- Demis Hassabis Demis Hassabis
- Smartdata The World’s Best Thinkers on Data
- Michael Jordan Michael Jordan
- Michael Jordan Michael Jordan
- Yann Lecun Yann Lecun
- Nando de Freitas Nando de Freitas
- 周涛 周涛博客
- yann.lecun 深度学习大牛之一
- 大数据微信公众号 大数据微信公众号汇总列表
- 阿杜点金大数据 阿杜白话大数据专栏
- Sebastian's blog Sebastian’s blog about Deep Learning
- 机器学习训练秘籍 吴恩达机器学习实战训练电子书
- Machinelearning mastery Get Started and Kick-Ass in Machine Learning
- Peter Norvig Peter Norvig
- 数据熊猫 数据分析学习交流社区
- ARTIFICIAL INTELLIGENCE PODCAST ARTIFICIAL INTELLIGENCE PODCAST
- Datascience Toolbox Start doing data science in minutes
- Learning Machines 101 A Gentle Introduction to Artificial Intelligence and Machine Learning
- Master Machine Learning Master machine learning by using it on real-life
- fast.ai making deep learning uncool again
- Yoshua Bengio Yoshua Bengio研究团队
- skyhigh skyhigh blog
- Geoffrey E. Hinton Geoffrey E. Hinton
- Andrej Karpathy Andrej Karpathy’s blog
- Dataists Fresher than seeing your model doesn’t have heteroscedastic errors
- 机器学习干货 机器学习干货
- Jürgen Schmidhuber Jürgen Schmidhuber
- 科学空间 苏剑林科学空间博客
- Jonathan Hui blog Jonathan Hui blog
- Allthings distributed Werner Vogels’ weblog on building scalable and robust distributed systems.
- deeplearning.ai Ng深度学习课程
- François Chollet François Chollet
- colah's blog colah’s blog
- 董的博客 关注大数据
- Distill it’s very cool
- Michael Nielsen Michael Nielsen‘ s blog
数据运营
- 百度预测 百度旅游预测,经济预测,赛事预测…
- 优酷指数 优酷指数排行榜,搜索排行,搜索数据分析
- TalkingData 移动数据分析,应用统计分析,移动运营分析
- 网络攻击分析 全球网络攻击数据分析,数据态势
- 百度大数据 百度开放的新商业“能源库”,旨在面向行业关键诉求,开放百度大数据核心能力,帮助企业先人一步创造新商业机会、实现用户体验的升级换代
- 谷歌趋势 谷歌搜索趋势指数分析,关键词分析,关注度排行
- 阿里巴巴指数 阿里巴巴网购价格分析指数,全网产品核心产品网购分析
- 全球经济 哈佛全球经济数据分析,进出口,经济形势…
- 友盟指数 移动开发者数据分析服务平台,设备指数,应用指数
- 微博指数 微博关键词数据分析,微博热点数据分析
- CNZZ 最大的中文网站统计分析平台
- Dataeye 移动游戏数据分析,应用商店分析,广告预测分析
- 阿里指数 阿里搜索关键词数据分析,预测分析
- 百度指数 百度关键词搜索分析,数据指数分析…
行业资讯
- 数盟 数据创造价值
- 炼数成金 专业的数据分析社区
- 机器之心 专注人工智能的前沿科技媒体与产业服务平台
- 网络大数据 网络大数据资讯
- 统计之都 中国统计学门户,免费统计服务网站
- 大数据微信公众号 大数据微信公众号汇总列表
- 大数据时代 大数据行业第一媒体
- 统计家园 统计领域资讯,软件工具,交流社区
- 大数据中国 关注大数据数据产业,大数据资讯门户
- 点金大数据 点金大数据,专业的大数据应用研究咨询网站
- InfoQ 促进软件开发领域知识与创新的传播
- 中云网 云计算,大数据资讯交流平台
- Datanami Datanami covers the big data ecosystem by providing news and insights from data intensive computing
- 数据观 中国大数据产业观察
- 产品经理AI资源库 产品经理AI资源库
- 数客 大数据科技的新媒体社区
- 数据挖掘研究院 中国数据挖掘门户网站,数据挖掘资讯技术社区交流
- 小象学院 专业的大数据在线教育平台