深度强化学习(机器学习、算法、应用)

机器学xi:Maching Learning,是实现人工智能的一种手段,也是目前被认为比较有效的实现人工智能的手段。目前在业界使用机器学xi比较突出的领域很多,例如计算机视觉、自然语言处理、推荐系统、文本分类等,大家生活中经常用到的比如高速公路上的ETC的车牌识别,苹果手机的Siri,看今日头条时给你推荐的新闻,再比如大家用天猫买东西看评论的时候的评价描述:

深度强化学习(机器学习、算法、应用)

语义分析

(可以看到通过机器学xi的算法,在8w多条评价中筛选出关键词,红色的是正面评价,绿色的是反面评价,这些都是通过语义分析算法归类得出的。机器学xi本质上是通过数学算法来解析数据的规律,学xi相关的规律且用来预测和决策。机器学xi主要分为监督学xi,无监督学xi和半监督学xi三种。从算法上来说有贝叶斯分类,决策树,线性回归,决策树和森林模型,主成分分析,流行学xi,k-means聚类,高斯混合模型等等。)

深度强化学习(机器学习、算法、应用)

AI

深度学xi:Deep Learning,是一种机器学xi的技术,由于深度学xi在现代机器学xi中的比重和价值非常巨大,因此常常将深度学xi单独拿出来说。最初的深度学xi网络是利用神经网络来解决特征层分布的一种学xi过程。通常我们了解的DNN(深度神经网络),CNN(卷积神经网络),RNN(循环神经网络),LSTM(长短期记忆网络)都是隶属于深度学xi的范畴。也是现代机器学xi最常用的一些手段。通过这些手段,深度学xi在视觉识别,语音识别,自然语言处理(NLP)等领域取得了使用传统机器学xi算法所无法取得的成就。

强化学xi:Reinforcement Learning,又称再励学xi或者评价学xi。也是机器学xi的技术之一。所谓强化学xi就是智能系统从环境到行为映射的学xi,以使奖励信号(强化信号)函数值最大,由于外部给出的信息很少,强化学xi系统必须依靠自身的经历进行自我学xi。通过这种学xi获取知识,改进行动方案以适应环境。强化学xi最关键的三个因素是状态,行为和环境奖励。关于强化学xi和深度学xi的实例,最典型的莫过于谷歌的AlphaGo和AlphaZero两位了,前者通过深度学xi中的深度卷积神经网络,在训练了大约三千万组人类的下棋数据,无数度电的情况下才搞出来的模型,而后者使用强化学xi的方式,通过自己和自己下棋的方式搞出来的模型。而最终的实验结果也很让人震撼。AlphaGo干败了人类围棋顶尖高手,而AlphaZero干败了AlphaGo.

效率技巧

word怎么删除不要的页?Word有三个实用小技巧

2024-2-3 9:22:18

效率技巧

什么叫app(全面解析APP的定义、功能和使用方法)

2024-2-3 10:42:47

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
有新私信 私信列表
搜索