浅谈群红包的实现

前言:
红包是支付的方式, 也是社交的延伸。群红包在这两块领域串联得很好, 表现尤为的浓墨重彩. 
承接上两篇技术浅谈:
1). 浅谈接龙红包的技术实现.
2). 浅谈微信红包摇一摇的技术实现.
这一次, 让我们谈谈群红包的技术实现. 一为是红包的分配算法, 二为竞抢的技术实现.

分配算法:
最初玩群红包的时候, 并没有意识到分配算法的难度. 下意识的觉得, 不就是个随机算法嘛? so easy! 后来在知乎上看到很多人在讨论, 才意识到该算法或许并不简单. 
好的东西, 往往让人觉得简单, 而其背后默默挨打的小怪兽(精细和缜密), 你是否可曾留意过.
我们先来看看, 最自然的随机算法, 为何不合理?
假设T为总金额, k为红包个数, 每次获取先保底(每人至少得最小金额为0.01), 然后取随机剩余数
则Ai的迭代公式为:

1
2
Ai = random(0.01, T – 0.01 * (k – i) – A0 – … – Ai-1)           (0 <= i < k – 1)
Ak-1 = T – A0 – … – Ak-2                                        (最后玩家所得)

貌似简单合理, 殊不知头重脚轻, 统计概率上, 排前面的值往往大于排后面的值, 当k很大, 最后几位往往会被收敛为0.01.
显然不合理, 这篇<<微信红包的算法实现探讨>>博文也证述了该现象. 

结合上面的例子, 一个好的分配算法, 必须具备以下几个条件:
1). 每个玩家都能领到红包
2). 所有玩家的红包钱数和等于总数
3). 无论哪个顺序位, 在红包分配上的概率是平等公平的
对了条件(3)的解读, 可以这么理解, 每个顺序位的预期红包分配数为N/k (N为红包总素,k为用户数). 一次分配差异大, 但统计重复M次, M越大, 预期平均值越接近N/k. 这就是宏观上的平等.

有人就以平均值做突破口, 引入截尾正态分布, 达到了非常好的效果.
浅谈群红包的实现
详细见<<微信红包算法探讨>>这篇博文, 这边具体也不展开了.

工程的角度, 我们可以简化算法, 用拟合的算法来近似代替.
概率函数为:

1
2
3
对于第i个玩家而言
随机生成(k-i)个 Bj (j=0,1,k-i-1), Bj范围在[0, 100]之间.
则概率函数P(i) = Bi / (B0 + B1 + … + Bk-i-1)

对于Ai, 则迭代公式为:

1
2
Ti = T – 0.01 * (k – i) – A0 – … – Ai-1
则Ai = Ti * P(i) + 0.01 = Ti * Bi / (B0 + B1 + … + Bk-i-1) + 0.01

因为使用加减乘除, 比用高级概率分布的sin/cos/log函数计算效率要高.

竞抢技术:
群红包的”抢夺”, 最重要的还是数据安全问题.说白了就是竞态条件下, 如何保证数据完整性和一致性
业内对该类问题, 有大致三种主流的做法:
1). 悲观锁思路
2). FIFO队列思路
3). 乐观锁思路
悲观锁思路, 常见的是借用mysql的SELECT … FOR UPDATE语句来实现.

1
2
3
4
begin transaction;        // (1)开启事务
select … for update;       // (2)锁定某行记录
update … set … where …;  // (3)进行记录更新
commit transaction;      // (4)事务提交

这边重点讲讲乐观锁机制, 其不光能用于关系数据库,也能用于NoSQL.
乐观锁的核心思想是, 基于版本号的更新, 前提是操作需保证原子性.
设计简化的红包表:
浅谈群红包的实现
注释: total_money为总金额, total_number为红包数, left_money为剩余金额数, left_number为剩余红包数
当用户拆红包时, 触发如下流程
(1) 查询群红包信息

1
2
3
SELECT left_money, left_number, version_id
FROM tb_hongbao
WHERE envelope_id = ‘?’;

(2) 计算所分配的红包
通过上述的方法, 通过left_money, left_number计算出具体的红包: delta_money
(3) 更新群红包信息

1
2
3
4
5
6
7
UPDATE tb_hongbao
SET
    left_money = left_money – delta_money,
    left_number = left_number – 1,
    version_id = version_id + 1
WHERE
    envelope_id = ‘?’ AND version_id = ‘old_version_id’

SQL是能保证原子性的, 带着上次查询回来的version_id去更新, 若version_id一致, 则更新成功, 版本号递增, 若不一致, 则需要重复1~3步, 直至成功或放弃.
这边讲述的利用mysql来实现的, 事实上有些Nosql系统也支持(大淘宝的Tair服务).

写在最后:
如果你觉得这篇文章对你有帮助, 请小小打赏下. 其实我想试试, 看看写博客能否给自己带来一点小小的收益. 无论多少, 都是对楼主一种由衷的肯定.

转自: http://www.cnblogs.com/mumuxinfei/p/4305979.html

原创文章,作者:stanley,如若转载,请注明出处:http://www.178linux.com/847

(0)
stanleystanley
上一篇 2015-03-10 16:00
下一篇 2015-03-10 22:41

相关推荐

  • Linux的终端类型

    一、了解终端   在早期的年代,主机不是很多,都是一系列的大型主机,简单来说就是用户很多,但主机很少,不可能做到人手一台,但可以在主机上连接一个分屏器,在分屏器上可以连接鼠标键盘以及显示器,这些东西是没有计算能力的,仅仅担任输入和输出的工作,运算和处理都是由主机来完成的。   简单来说终端是用户与主机交互,是必然用到的…

    Linux干货 2016-10-14
  • MBR分区和GPT分区详解

    什么是磁盘分区?               磁盘分区是使用分区编辑器(partition editor)在磁盘上划分几个逻辑部分,盘片一旦划分成数个分区(Partition),不同类的目录与文件可以存储进不同的分区。越多分区,也就有更多不同的地方,可以将文件的性质区分得更细,按…

    Linux干货 2016-08-29
  • linux中用户、组和权限认识

    linux中用户、组和权限认识 Linux 用户和组的主要配置文件:/etc/passwd :用户及其属性信息( 名称、UID 、主组ID 等)                  …

    Linux干货 2017-02-23
  • 文本处理工具练习题(包含正则)

    正则练习题(包含文本处理练习题) 问题 找出ifconfig命令结果中本机的所有IPv4地址  查出分区空间使用率的最大百分比值 查出用户UID最大值的用户名、UID及shell类型 查出/tmp的权限,以数字方式显示 统计当前连接本机的每个远程主机IP的连接数,并按从大 到小排序 答; ifconfig | grep -o '[0-9]\…

    Linux干货 2016-08-08
  • Linux救援模式

        学习了Linux的启动流程,为了加深理解,今天做了如下的实验:删除掉Linux系统在启动过程中比较重要的几个文件,查看启动时出现的现象。加深对知识的理解。学习机器因为某些文件的缺失的修复方式。     一、删除grub.conf    &nb…

    Linux干货 2016-11-23
  • centos启动流程

    加电自检 检测硬件是否存在并且能够正常运行,如cpu、内存、硬盘是否存在并能正常运行,以及外围得输入输出设备是否存在,如键盘、鼠标、显示器。 bios启动次序,按照次序查找个引导设备,启动第一个具有引导程序的设备,即为本次启动需要加载的设备。 加载boot loader bootloader安装在mbr中,linux的bootloader程序为grub和li…

    Linux干货 2017-11-14

评论列表(1条)

  • 红豆殺
    红豆殺 2015-03-13 09:52

    看到这算法,隐隐有种高数的感觉~ :eek: