lornd's blog

[论文解读]DRN: A Deep Reinforcement Learning Framework for News Recommendation

论文地址：DRN: A Deep Reinforcement Learning Framework for News Recommendation 。研究背景由于新闻特征与用户偏好特征是不断发生变化的，在线个性化新闻推荐是一个很有挑战性的工作。现在已经有一些个性化新闻推荐的模型，如基于内容的方法、基于协同过滤的方法、混合方法等。但是这些方法存在着以下问题：这些方法只对即时奖励（如点击...

2023-02-24

阅读全文

[解题报告]力扣双周赛73D

这道题目使用的贪心非常大胆（在做的时候没有想到），特此记录。题目地址：2193. 得到回文串的最少操作次数 - 力扣（LeetCode）题目大意给定只包含小写英文字母的字符串 sss 。每一次操作，可以选择 sss 中两个相邻的字符，并将它们交换。求将 sss 变成回文串的最少操作次数。保证给定的字符串能够变成回文串。 ∣s∣≤2000|s| \le 2000∣s∣≤2000 。 ...

2022-03-22

阅读全文

[强化学习从入门到入土]强化学习基础

申明：本系列为《深度强化学习：基于 Python 的理论及实践》一书及相关论文的学习笔记。从零开始的强化学习，那必然要先了解一些最基本的概念，为之后算法的学习打好基础。引入在日常生活中，我们经常会碰到一些顺序决策问题（任务），如下棋、驾驶等。在这些问题中，首先，我们会有明确的目标：赢下这一场棋，或者是安全到达目的地；其次，我们每采取一个动作，都需要接受外界的的反馈，如棋盘上局势的优劣，...

2022-02-07

阅读全文

蚁群算法与 TSP 问题

TSP 问题旅行商问题（Travelling Salesman Problem，TSP）：给定一系列城市和每对城市之间的距离，求解访问每一座城市一次并回到起始城市的最短回路。蚁群算法蚁群算法（Ant Colony Optimization, ACO）是人们受到自然界中蚂蚁在寻找食物过程中发现路径的行为启发而提出的一种算法。因此，要理解蚁群算法，我们需要先理解蚂蚁发现路径的行为。众所周...

2021-12-01

阅读全文

2020 年度总结

不得不说，音乐会才是慰藉心灵的最好方式。看完“最美的夜”之后，时钟拨到 2021 ，再来回顾 2020 ，想过很多总结的词语，现在心中只剩下了一个：感谢。感谢疫情。虽然它一点也不讨人喜欢，甚至搅扰了世界线的正常律动，但是也让我明白了我家的屋顶能够看到多么美丽的风景，“上房揭瓦”的快乐，不仅仅是三岁小孩所独有的。头顶上湛蓝的天空，天空下远方的群山，山沟里热闹的小城，小城中错落的房屋，屋顶处精...

2021-02-11

阅读全文