江湖夜雨十年灯

常用 AI 工具推介

李二花 / 2024-03-26


现在市面上五花八门的 AI 工具都在强调自己很能打,但是到底哪些适合我们的工作生活呢?(时效性到 2024 年 3 月份)

从 23 年初到现在我也使用了非常多的此类工具了,在这里介绍几个在我的工作生活中扮演了十分重要角色的几个工具。 同时也简单介绍一些我觉得很有意思的可以形成一套工作流的工具。

准备工作

我要推荐的大部分的工具都是海外的产品,这些产品基本都会限制使用的 IP,因此为了能够正常的访问这些工具,需要你会科学上网。

之前也专门写过一些相关的内容,这次就做一个小的总结,然后把之前的一些链接也贴到这里,如果想要了解的话,可以看看。

app 功能 价格 地区 支持的系统 详情
quantumulx-t 流量分流 $8 美区 ios, macOS 详情
shadowrocket 基本配置 $3 美区 ios, macOS 十分简单,无需教程
clash 配置 + 分流 free 开源 无 ios 详情

其中 clash 因为一些原因,已经删库了,目前只能去一些备份地址获取。

另外还有一些其他比较优秀的产品比如 surge, loon 等,但是对于我而言,这三个已经十分够用了。

当然这三个只是科学上网的工具,而具体的流量就需要你自己找方法了,有以下几种方案可以考虑:

我是这三种方案都在用,使用的是混合方案,流量包主要是用来走一些小众区域的流量的,比如土耳其和尼日利亚(同样的产品,土区和尼日利亚区价格会便宜很多,比如 spotify)。 自己购买搭建的主要用来走流量大的场景,比如看网飞的剧,刷 youtube 等,而 cloudflare 的一般是用来做兜底的,比如另外两个出了问题,我拿来应急用。

之前写的一篇关于 v2ray 的文章里面粗略的介绍了科学上网的原理,看这里.

关于赛博佛祖 Cloudflare 我之前的一些相关文章:

除了赛博佛祖外,还有赛博菩萨(supabase)和赛博罗汉(vercel), 都是个人用户必备神器。

工具介绍

会话类工具

chatgpt

这个是我一直在用的,一些脏活累活都交给他来做,比如:

当然现在有了 kimi 之后,一些长文也会经常去问 kimi

poe

poe 是不是一个单纯的会话工具,是一个工具的集合平台,里面有各种各样的产品,包括 openai 的 chatgpt, 包括 claude 3, 包括一个其他大模型的工具。

我一般用这个平台是进行尝鲜,作为一个工具的集合,他是 OK 的,另外它便宜,gpt4 的会员版本是 $20 每月,而你使用相同的费用,可以购买到 poe 内集合的多种工具的会员权益。

kimi

kimi 是国内月之暗面出品的一款会话工具,目前依旧是免费的,上下文也比较长,支持联网和文档,我一般用来让他干一些更累的活,比如帮我处理 json 数据。

Ollama

Ollama 是一个本地运行模型的平台,你可以从平台下载任何你想运行的会话模型,然后跟他对话,除了可以在命令行运行外,有许多的 web-ui 可以跟 Ollama 交互。

Ollama 对机器的性能有一定的要求,小模型普通的 mac 机器可以跑起来,但是如果模型比较大,那普通的机器就跑不起来,需要专门的工作站了,不过可以放心的是,我已经试验过了 llama2 可以在 mac 上运行。

brew install ollama
ollama run llama2

翻译类工具

沉浸式翻译

是一款 chrome 插件,可以配置 openai key, gemini-pro key 来做页面的翻译,同时也支持普通的 google 翻译等,我一般用来做一些粗筛的工作时使用。

openai-translator

推友 yetone 开发的,支持 chrome 插件,支持各端的客户端版本,也是可以配置 openai key, gemini-pro key 等来做翻译工作,目前是我精读某些文章书籍时的必备产品。

比如最近在读的一本「THE PH.D. GRIND」就会用它来查一些学术方面的内容。

图片类工具

midjourney & 悠船

midjourney 以前是我使用的一个产品之一,每个月需要付费会员,但是后来发现了国内代理的悠船是免费的之后,开始用悠船,可以暂时认为这两者基本没有什么太大的差别。

悠船注册需要依托企业或者学校名义,我因为依旧保留着学校的邮箱,因此使用学校邮箱注册的。

这两款产品在生成的图片的质量和契合度上,感觉各有千秋, 也可能是我提示词写的不好,比不出来, 对比下两款产品生成的图片:

提示词: 欲买桂花同载酒,终不似,少年游

提示词: 夜雨秋灯

stable diffusion

相比于 midjourney 的开箱即用(付费用户),SD 的成本会高很多,但是精细化程度和可控程度要更高。

高成本体现在模型是跑在本地机器的,所以需要你有很好的显卡才能运行 SD,精细化是指除了 prompt 外,加上 lora, controlNet 等的加持,可以产出一些完全自己定制的图片。

stable diffusion 之前也写过几篇文章来介绍,同时,除了之前文章提到的部署方式,目前有了集成版本的,更加方便快捷。

集成版下载链接 提取码: 1026, 如遇过期,请左下角对话联系我。

同时对于 lora, controlNet 的介绍可以看这个文档,也可以直接问 GPT.

具体的使用教程请善用 google。

音频类工具

suno.ai

suno.ai 可以让你提供歌词,和对应的歌曲风格就可以生成质量很高的歌曲,我目前生成的 8 首里,有几首觉得还蛮好听的。

点击下面两条链接即可收听对应的 ai 歌曲:

So-VITS-SVC

这个项目跟 SD 类似的,都是使用 gradio 开发的一个工具,功能是推理声音,可以将你给定的音频替换为训练好的模型的声音。

步骤就是使用 UVR 这个软件来分离人声和伴奏,然后使用 So-VITS-SVC 替换声音为模型声音,当然 So-VITS-SVC 也可以训练声音模型,具体的步骤可以看 藏师傅的教程.

这里是我训练的孙燕姿唱的「摇篮谣」, 这个是原版的, 可以对比听下。

如果你想训练自己的声音为模型,需要一个几个小时的朗读声,然后使用 So-VITS-SVC 就可以训练一个模型,需要注意的是,需要你的电脑配置还不错。

所有的软件的下载链接(不包含孙燕姿声音模型) 提取码: 1026, 如遇过期,请左下角对话联系我.

其他工具

其他工具大概得分类有:写作类,办公类,设计类,编程类等, 做好付费准备,任何优秀的工具都值得我们付费(除非有免费版,哈哈哈哈哈哈哈)。

写作类

办公类

设计类

编程与声音

提示词

其他