前两天在OpenAI
开发者大会上看到ChatGPT的能力进一步提升,API接口费用降低,又一次震撼了我。从今年2月ChatGPT大火,到现在11月份已有9个月了,结合当下行情,不然不让人焦虑,如果越来越多的岗位都被AI抢走了,那么平民百姓如何体面的生活?技术的车轮不是滚滚向前,而是还有加速向前的趋势,没有人能阻止它前进,或许我们唯一能做的是学习它,使用它,先跑赢同伴吧,这样说或许很残忍,人类的进化史不正是这个过程吗?
今天打算系统梳理一下ChatGPT相关知识,围绕以下问题深入研究
- ChatGPT的注册、GPT4开通。
- ChatGPT的使用技巧。
- 浅谈ChatGPT原理。
# ChatGPT发展历程
- 2023年1月份用户量超过1个亿
- 2月10日推出会员计划20美刀一个月,能够更快响应和体验新功能
- 3月15日推出GPT4。Plus会员才能用,3小时只能用25次,由于只能使用海外信用卡,国内用户大都用不了
- 3月23 支持小范围的插件Alpha 功能
- 4月份 活跃用户达1.73亿
- 5月13日 向所有的plus会员提供联网功能+插件功能,直接补足了被诟病的数学计算能力差及不能联网更新问题
- 5月19日上线IOS APP
- 7月14日联网模式下先
- 7月15日推出 Code Interpreter 模式
- 7月20日 3小时只能25次,增加到50次
- 7月21日 上新了个人定制指令 Custom Instructions
- 7月25日 androidApp上线
- 8月4日 小功能更新, 如文件上传、快捷键
- 11月7日 GPT-4 Turbo 发布会, 支持128K上下文、训练数据更新至2023年4月、支持图像输入总结图像内容、GPT商店、API降价
目前的整体数据是
- 每月访问量15亿次
- 活跃用户2亿多
- 运营成本2000多万美金一个月
- 年底预计营收2个亿美金
- 明年预计营收10个亿美金
- 微软追加投资100个亿,很火很烧钱不差钱
# ChatGPT的注册使用
chatGPT官网
chatGPT的注册
关于chatGPT的注册使用,我在今年2月份的时候参考这篇文章 国内用户如何使用chatGPT 注册了账号,现在链接失效了。大致过程是,注册需要一个国外手机号,不支持国内用户, 没有国外手机号怎么办? 这里借助一个 接码平台 弄个虚拟的手机号,短信会发送到这个平台。 访问这个网站需要科学上网,梯子自备。选择chatGPT服务,当时选择的哪个国家或地区的手机号也不记得了,往这个站点充了几块还是几十块钱也不记得了,充值很简单,支付宝扫码支付即可,这个号码是按小时租的,下次要想用,好像也能租到,价格会高一点,但是注册chatGPT时我绑定了goole账号,虽然没有手机号了,我每次都是用google账号登陆。
# GPT4开通
想要开通GPT4需要美国的信用卡,到国外办卡肯定不现实, 就需要使用虚拟信用卡,充值信用卡又需要加密货币的稳定币,整个过程还是比较麻烦的,该方式主要有两种方案
Dupay
+ Okx
OneKey
+ 币安
我使用的是方案一, Dupay
的前身是Depay
,它和OneKey
的作用就是创建虚拟信用卡。
第一步:肯定是到Dupay官网注册账号,你可以用我这个邀请码注册,具体过程略
第二步:申请VISA类型的卡(Dupay可以申请万事达和VISA两种类型的卡, 由于VISA标明了支持chatGPT,不选万事达是怕万一不支持chatGPT就完蛋了)\
这里有个KYC认证,可理解为国内的实名认证,有三种类型的卡可选择
一般建议选高级卡,此外每个月要交0.5$
月费,办卡手续费确实高!KYC认证完了要缴费,没有美刀,只能暂停一下,,,
第三步:注册欧易账号,购买USDT
转入Dupay
账户
这里解释下欧易是区块链的交易所,它有很多个功能(购买各种虚拟币、虚拟币金融衍生品)这里我们只用到它购买USDT
。USDT
是虚拟稳定币,1:1对标美元。具体下载注册过程可以参考这个视频。另外提示3点
- 建议通过网页注册 (手机上ios需要北美appid才能下载, android在你使用支付宝或微信的时候提示风险)
- 关键信息账号密码、助记词保存好
- 这里有个邀请码
59255404
,据说有新手福利
第四步:欧易提现到Dupay
账户 具体参考这个视频吧。
第五步:上一步转账大约3-5分钟到账,然后将USDT兑换成美刀然后继续开卡
第六部: 开发完成取chatGPT官网升级会员。注意Dupay的VISA卡的cvv安全码对应chatGPT官网上填写银行卡信息中的CVC。
该方案费率很高
- 交易所 快捷买币 USDT -4%
- 交易所 USDT 提币到 虚拟卡APP -3.82USDT
- 虚拟卡APP USDT 转换为 USD -1%
- 虚拟卡APP USD 提现到虚拟卡 -1.4%
# IOS用户注册和开通PLUS
如果你是IOS用户,那么恭喜你,注册ChatGPT账号不要花钱(在app上注册不需要手机号,但是使用API Key时必须绑定手机号)。可以在App Store
下载chatGPT app并注册。另外可以通过礼品卡的方式购买PLUS会员,费率损失<1%
在App Store
下载ChatGPT需要准备一个美国APPID,可以参考油管这个视频 注册美国区APPID,设置付款方式无,支付宝购买AppStore礼品卡,充值AppStore,然后进入ChatGPT开通,最后记得前往系统设置里取消订阅。
注册APPID需要一个干净的国外邮箱,推荐用account.proton.me
这个网站注册,因为不需要手机号。
苹果的设计有个Bug(或者说叫缺陷吧,无解),支付与APPID关联, 举个例子:
比如某个APP1安装需要支付USD,你使用APPID为A的账号在APPStore下载安装了APP1,你的朋友也想下载APP1,那么可以让你朋友的手机登录你的账号下载APPI,然后再切回他的账号,这是他不用支付费用就可以使用APPI。
另外我觉得 android用户也不用走虚拟币的方式充值GPT会员了,买个礼品卡,借朋友的ios手机用一下就行了。
# 使用感受
以下是我的一些测试用例
一个蜗牛掉到一个井里,井深5米,它每天能爬3米,往下掉2米,请问它几天能从井里爬出来。 4能答对,3.5不行
websocket为什么没有跨域问题 回答的结果不是我想要的
TS类型体操方面问题 印象中,3.5回答的不好有些乱扯
我问了一些电视剧人物相关的问题,感觉回答的不行,不知道是不是与训练数据有关
# AI绘图
能画一些图片,还是挺美的,但是让他修改,不太尽如人意,偶尔也会出错,比如他给我生成了一副夏天海滩的照片,尽然有无头人。
后来按照网上UP主的指示,如果想要人物不变,可以让它返回 seed值,我生成了几张图,挺美的,给大伙看看。
Q: 给我生成一副画,一个中国乡村姑娘在田园中散步, 并返回seed值
Q: 这位姑娘手里拿着一朵花, seed值:2011363862
Q: 她微笑着向我招手 seed值:4056027149
Q: 我想看一下它的背影, 请给我一张长图, seed值:4056027149
Q: 这个脖子太长了,能短一点吗, 另外图片给我宽幅, seed值:4056027149
绝了,怪不得日本学艺术的小姑娘要自杀,哎!
我再让它生成走路的照片,她不会制作GIF图,经过我几轮调教还是有些问题
也许模型算法再进化一些,训练数据再大一点,它真的能创作出能够直接用于游戏、视频创作的素材了,希望这一天晚一点到来吧!
过了两天,我把前面的三张图上传上去,让它再给我画几幅画,,
脸部还原的还行,但是我又测出来一些问题
- 它好像对阳光的角度不太理解
- 它不会微调或修改图片中的错误,新生成的图人物和背景改动都大
- 能识别和对比png图片,但webp格式的图片不能识别和对比
# 打造专属的客制化APP
前几天的Turbe发布会,奥特曼说ChatGPT支持定制个人专属聊天机器人了。
推荐使用Configure的形式创建机器人, 填一些内容就可以提问了。
我们在发散想一下,如果关于这个人的资料很多,把它们上传到AI,这部就克隆出一个人型机器人了吗?
# 更多关于ChatGPT
- Github有个大佬写了一个项目
Pandora
现在github上不到了,不过参考这篇文章,通过docker的方式安装,安装后进入docker容器可以看到源码,用python写的,通过Cloudflare跨过长城,封装了auth登录,实现国内访问ChatGPT。不过这版UI有点老,dockerhub上看到作者推出了pandora-next。这个镜像是最新的UI。
- 油管和github很多好东西, 关于AI方面,如AI绘图、制作有意境的图片、 AI去码去水印、AI换脸等,自己搭建AI应用,重点是开源免费,还有就是依赖你显卡性能。
- AI绘图还有一些软件
Midjourney
、Canvas AI
- VScode有一些AI相关的插件,TODO
# 搜索技巧
尽管ChatGPT很强大,但还是存在回答不对或不准确的情况,搜索引擎是一个补充方案,很多场景也离不开搜索引擎。这里记录一下我在油管看到的一些搜索技巧。 油管视频
""
限定关键字
intile
限定标题
allintitle
限定标题包含多个关键词
intext
限定内容关键字
inurl
限定网址关键字
imagesize
限定图片尺寸
filetype
限定文件格式
# chatGPT底层原理浅谈
- chat: 聊天
- G:
Generative
生成式
- P:
Pre-trained
预训练
- T:
Transformer
神经网络
简单说chatGPT真正做的事情是文字接龙的大语言模型。
文字接龙以token为单位,根据前面的token预测下一个token出现个概率分布,根据摇骰子给出答案继续计算下一个token。
一般平均一个单词0.75token,一个汉字可能1~3个token,token根模型有关,具体可以在这个网站查
给两个案例证明它是玩文字接龙的游戏
案例1:
其实并没有上海亚运会,是杭州亚运会,下面的网址也是AI臆想的。
案例2: 让它写一个1000字某主题的作文,它会在半句中中断。
那么它如何记得你过去说过的话呢? 其实很简单,每次提问就会把前面的话带过去,比如chatGPT3.5支持4K token,如果超过4K的内容就采用FIFO算法,所以如果聊天超过一定字数它会忘记你之前说的话。
如何计算下一个token的分布几率呢?先来看一张图
这个语言模型的背后是类神经网络,类神经网络你可以理解为从一堆函式中选出的一部分函式, 每个函式输入是不完整的句子,输出是下一个token的概率分布,每个函式有上亿个参数,函式里面是线性代数矩阵运算。
按照这个模型,如果训练的数据增加,回答的准确了也确实会增加,但正确率无法超过55%,而人类有90%以上的正确率。
督导式学习起到画龙点睛的作用
如果人为的给一些数据打上标注,喂食AI,即使最小的模型也比最大的无训练的机器学习模型要更准确。如下图。
预训练: 在机器自我学习前的人工督导式学习叫做预训练, 预训练的模型叫做基石模型, 在此额基础上的继续学习叫做微调
此外研究发现,在多重语言上做预训练后,只教某一语言的某一任务,机器也能自动学会其他语言的同类任务,如下图
此外chatGPT还会增强式学习,你每次使用chatGPT时,对回答点赞或者点bad赞,都是对ChatGPT的增强式学习。
GPT3经过督导式学习和增强式学习后的模型就叫GPT3.5
# 使用总结
虽然我对AI领域只是了解一些皮毛,对chatGPT的使用技巧也有待提升,但总结必须有,这样才能熟练运用。
ChatGPT3.5功能总结
- 仅支持纯文本输入,支持4K上下文
- 响应速度比较快,支持翻译,自然语言与机器语言转换,内容相对搜索引擎靠谱。
- 但对于有技术深度的问题,或强逻辑、脑筋急转弯问题回答的不好
ChatGPT4功能总结
- 支持文本输入,文件输入,支持128K上下文,支持联网
- 输出更准确,逻辑能力也有提升,但响应速度较慢
- 提供了插件系统,通过插件弥补了数学逻辑方面的不足等问题,通过插件还可以语音输入语音输出
优缺点和应用场景
- 国内用户每月主要支付>140RMB,每日5元的费用,对平民百姓来说还是比较贵的
- chatGPT冲击会很大,教育、培训机构、编程、创作等,介于目前chatGPT的逻辑推理、作图等方面有待提升,chatGPT提供的还只是半成品,属于半自动驾驶,目前阶段需要快速掌握chatGPT的使用技巧
一些使用技巧
- 把需求讲清楚
- 提供范例, 比如让它写晶晶体(夹杂英文)的文章, 要先教会他晶晶体是什么。
- 鼓励chatGPT想一想
- 使用咒语
- 拆解任务
- 自主进行规划
- 让GPT反思
- JoHari沟通视窗,检测,反向提问
关于新技术最后在引用油管UP主的几句话,个人感觉很受用
不管什么新技术出来,最先嗅到商机的总是那些卖课的机构。 追热点很正常也很合理,\
不过呢,有的是真的在给你介绍前沿科技 介绍背后的技术原理,给你介绍技术的应用场景和局限,帮你拓展认知。\
有的却是在跟你忽悠,你不学GPT你就会被AI淘汰,现在直播价199最后5分钟下播就是899,而且每天循环播放,这些呢是哎,不知道怎么说,当然很多人就是会被割韭菜,不是因为他没有判断能力,只是因为他身在别人的私域,说实话绝大部分的课程内容,还不如油管上的免费分享
也许有人会说ChatGPT只是一个学习了大量知识,经过人类老师调教,精通文字接龙游戏的机器,并非真的有逻辑推理能力。个人认为是不是真懂这个问题没那么重要了,这就好比人类发明了钻木取火不知道氧化反应,爱迪生发明了电,不知道电子是什么,未来世界如何很难想象。洪水猛兽既然放出来了,只能接受它、学习它、使用它、拥抱它、与它共存!
本文作者:郭郭同学
本文链接:https://blog.warmplace.cn/post/chatgpt