1. 显存单位换算在讨论显存占用时,首先要明白“B”和“G”的含义。通常,“B”指的是十亿(1B = 10^9),而“G”则表示千兆字节(1G = 10^9字节)。例如,1B参数意味着有10亿个参数。显存的单位通常以字节计算,而1个字节等于8位。🎈如果使用全精度训练(fp32),每个参数需要占用32位(即4个字节),因此1B的参数需要占用4GB的显存。🎈如果使用半精度(fp16或bf16),则每个参数占用2字节,1B的参数只需占用2GB的显存。
2. 显存开销的其他组成部分除了模型参数本身外,训练过程中还会消耗一定的显存,主要包括以下几部分:🎈梯度:每个参数对应一个梯度,因此梯度的显存占用与参数量相同。🎈优化器状态:优化器,如Adam,通常会为每个参数保存一阶动量和二阶动量,因此优化器的显存开销为参数量的2倍(对于Adam)。对于其他优化器(如SGD),则取决于优化器的具体实现,若是带动量的SGD,则为参数量的1倍。
3. 显存总占用计算假设我们训练一个参数量为1B的模型,采用全精度(fp32)并使用Adam优化器,显存的占用计算如下:🎈参数:1B × 4GB = 4GB🎈 ...
生活日常
未读理论部分这里简单介绍下常用的代理工具,并区分下Shadowsocks和ShadowsocksR的区别
代理工具科学上网的原理step:
本地客户端 与 远程代理服务器 建立加密隧道。
本地流量通过隧道发送到代理服务器。
代理服务器解密请求,访问目标网站(如 Google)。
返回的数据再次加密传回本地客户端。
下面是关于代理工具常见的实现方式:
HTTP/HTTPS 代理用于网页浏览器等支持 HTTP/S 的客户端。
代理服务器处理 HTTP 请求,并转发给目标网站。
缺点:不能代理非 HTTP 协议的流量(如游戏、软件更新等)。
SOCKS5 代理更通用的代理协议,支持任何协议(TCP、UDP)。
应用层更透明,可以代理 Telegram、游戏、FTP、P2P 等流量。
常见工具:Shadowsocks、V2Ray 的 SOCKS5 模式。
VPN(虚拟专用网络)创建一个本地设备与远端服务器之间的加密通道。
所有流量都通过该通道传输,相当于把你“搬到”另一个国家上网。
协议示例:OpenVPN、WireGuard、L2TP、IPSec。
隧道转发工具(Tun ...
1.人工智能竞赛平台 Biendata:Data Competition Community - Biendata介绍:
2018 年 5 月,人工智能和大数据的竞赛平台 Biendata 完成天使轮融资,由DeepTech深科技投资,旨在打造中国人工智能赛事顶级 IP,赛事相关媒体运营。Biendata 的比赛客户既包括今日头条、知乎、摩拜、搜狐等企业,也包括了 IEEE、ACM、中国计算机学会、中国人工智能学会等国内外顶尖学术组织。
总体上来说就是一个各自AI比赛汇总的平台(除了一些大厂有自己的大规模AI赛事比如阿里云天池、华为云、百度、腾讯),类似的办赛平台IP还有
datafountain:数据科学竞赛/大数据 竞赛 - DataFountain
Kaggle(国外):Kaggle Competitions
时间:基本上是什么时间都有,需要持续关注官网,同一个企业基本每年举办的timeline不变
2.阿里云天池:算法大赛-天池大数据竞赛-天池大赛-阿里云天池介绍:老牌,2014年启办,面向全世界科研人员和高校师生,业务场景丰富(2B2C都有cover),奖金池也丰富。 ...
2025.03.17 愛(あい) 爱 池(いけ) 鱼塘 おはよう 早上好 おねがい 拜托了 はい 是的 煩い(うるさい) 烦人的 いいえ 不,不是 可愛(かわいい) 可爱的 かっこいい 帅的 傘(かさ) 伞 御手洗い(おてあらい) 厕所2025.03.19 海(うみ) 海 嘘(うそ) 假话 世界(せかい) 世界 寿司(すし) 寿司 美味(おいしい) 好吃 お菓子(おかし) 点心 菊(きく) 菊花 君(きみ) 你 声(こえ) 声音 柿(かき) 柿子2025.03.21 最高(さいこう) 最高,最好 顔(かお) 面孔,脸 猫(ねこ) 猫 たこやき 章鱼烧 机(つくえ) 桌子 何(なに) 什么 年(とし) 年龄 夏(なつ) 夏天 梨(なし) 梨2025.03.23 招き猫(まねきねこ) 招财猫 あほ 白痴 兄(あに) 哥哥 西(にし) 西 下手(へた) 不擅长 地下鉄(ちかてつ) 地铁 うまい 好吃 耳(みみ) 耳朵 味增汁(みそしる) 味增汤 雨(あめ) 雨2025.03.25 山(やま) 山 彼(かれ) 他 無理 ...