随着生成式AI进入主流领域,AI生成的色情内容也随之兴起。与其更受尊敬的兄弟产品一样,AI色情生成器的质量也在不断提升。
大约一年前,TechCrunch报道了AI色情生成器的初步发展。当时,这些应用程序还处于萌芽阶段,数量相对较少,其生成的内容质量也远称不上“好”。这些应用程序和支撑它们的AI模型难以理解解剖学的细微差别,经常生成一些有着奇怪身体的图像,这些图像看起来像是出自大卫·柯南伯格电影中的角色。合成的色情内容中的人物往往有多余的肢体,或者鼻子上有一个乳头等令人不安的扭曲身体。
快进到今天,搜索“AI色情生成器”可以在网上找到几十个结果——其中许多是免费使用的。至于这些图像,虽然它们并不完美,但一些可以轻易被误认为是专业艺术作品。
然而,伴随着技术的进步,伦理问题也日益突出。
随着AI色情内容和生成工具的普及,它们开始对现实世界产生可怕影响。
Twitch主播Brandon Ewing(网名Atrioc)最近在直播时被发现浏览未经同意生成的知名女性主播的色情深伪图像。尽管这些深伪图像的创作者最终屈服于压力,答应删除它们,但损害已经造成。到今天,这些女性主播们仍然会在私信中收到这些图像,遭受骚扰。
网络上的绝大多数色情深伪图像或AI换脸都是针对女性的,并且经常被用作武器。
《华盛顿邮报》的一篇文章讲述了一位小镇教师因为学生家长发现了未经她同意制作的AI色情图像而失去了工作。几个月前,一名22岁的男子因为从社交媒体上获取未成年女性的照片并使用它们制作色情深伪图像而被判处六个月监禁。
更令人不安的是,色情AI技术将魔爪伸向了儿童,在暗网上流传写实的AI生成的儿童性虐待材料有所增加。据Fox News报道,一名15岁的男孩被一个网上健身爱好者群体的成员勒索,该成员使用AI色情生成器将男孩裸露胸部的照片编辑成裸体图像。
与此同时,Reddit用户被AI色情模型欺骗,购买了不存在的人的裸照。成人影视和艺术领域的从业者对此表示担忧,这对他们生计和行业产生了影响。
然而,这些问题并没有阻止Unstable Diffusion这个最初的AI色情生成器团体继续前行。
当Stability AI开发的文本生成图像AI模型(Stable Diffusion)在去年年底开源时,互联网很快将其用于色情内容的创建。一个名为Unstable Diffusion的团体,在Reddit和Discord上迅速发展。随着时间的推移,该团体的组织者开始探索在Stable Diffusion基础上构建并货币化他们自己的生成色情模型的方法。
Stable Diffusion像所有文本生成图像的AI系统一样,经过数十亿张带字幕图像的数据集训练,学习书面概念和图像之间的关联,例如“鸟”这个词不仅可以指蓝知更鸟,还可以指鹦鹉和秃鹰,以及更抽象的概念。
由于Stable Diffusion的数据集中只有一小部分包含不适宜公开观看的材料,在处理成人内容时缺乏经验。因此,Unstable Diffusion的管理员招募了志愿者——主要是Discord服务器成员——来创建用于微调Stable Diffusion的色情数据集。
尽管遇到了一些挫折,包括被Kickstarter和Patreon禁止,Unstable Diffusion还是设法推出了一个全面的网站,提供自定义艺术生成AI模型。在筹集了超过2.6万美元的捐款、获得用于训练生成式AI的硬件并创建了一个包含超过3000万张照片的数据集后,Unstable Diffusion推出了一个平台,据称现在每天有超过35万人使用该平台生成超过50万张图像。
Unstable Diffusion和Equilibrium AI的联合创始人之一Arman Chaudhry表示,Unstable Diffusion的重点依然是创建一个“支持表达自由”的AI艺术平台。
“我们在推出网站和高级服务方面取得了进展,提供的不仅仅是一个工具,而是一个让创造力得以蓬勃发展的空间,”他通过电子邮件告诉我。“我们相信艺术应该是不受限制的,这一理念指导了我们对AI工具及其使用的方式。”
Unstable Diffusion的Discord服务器反映了这种无所顾忌的理念。
服务器的图像共享部分分为两个主要类别:“SFW”和“NSFW”,后者的子类别数量略多于前者。SFW中的图像涵盖了从动物、食物到室内、城市和风景等各个方面。NSFW则包含——正如人们所料——男女的露骨图像,但也包括非二元性别的人、动物拟人化形象、“非人类”和“合成恐怖”(如多肢人或皮肤与背景风景融合的人)。
在我们上次浏览Unstable Diffusion时,几乎整个服务器都可以归入“合成恐怖”频道。由于缺乏训练数据和技术障碍,社区的模型在2022年末难以生成接近写实的图像——甚至是半成品艺术品。
写实图像仍然是一个挑战。但现在,Unstable Diffusion模型生成的许多艺术品——动漫风格、卡通渲染等——至少在解剖学上是合理的,少数情况下甚至完全准确。
Unstable Diffusion Discord服务器上的许多图像是多种工具、模型和平台的混合产物——并不仅仅是Unstable Diffusion网络应用。因此,为了看看Unstable Diffusion模型具体进步了多少,我进行了一个非正式测试,生成了一些描绘不同性别、种族和民族的人物从事性行为的SFW和NSFW图像。
Unstable Diffusion这个应用程序并没有明显的“色情”迹象。它的界面相对简洁,提供调整图像后处理效果的选项,如饱和度、纵横比和图像生成速度。除了提示词外,Unstable Diffusion还允许你指定希望排除在生成图像之外的内容。而且,由于整个项目是商业性的,还有付费计划可以增加同时生成图像请求的数量。
我发现,通过Unstable Diffusion网站生成的提示词结果是服务性的——尽管不可预测。模型显然还不太理解性行为,有时会导致奇怪的面部表情、不可能的姿势和不自然的生殖器。一般来说,提示词越简单(如单独的定妆照),效果越好。大多数涉及两人以上的场景都是地狱般的噩梦。
模型显示了生成式AI偏见的典型迹象。
大多数情况下,通过Unstable Diffusion运行的“男性”和“女性”提示词生成的图像都是白人或亚洲人——这是训练数据集中不平衡的症状。大多数关于同性恋色情的提示词则莫名其妙地默认生成带有剃刀头发型的拉丁裔人。这是否反映了模型训练时的同性恋色情类型?这值得猜测。
身体类型默认情况下也不多样化。男性肌肉发达,身材健壮,有六块腹肌。女性则身材苗条,曲线优美。Unstable Diffusion完全有能力生成更多样的人物,但必须要在提示词中明确说明,我认为这不是最包容的做法。
偏见在职业性别角色中表现得有所不同。给定一个包含“秘书”一词且没有其他描述的提示词,Unstable Diffusion通常会描绘一个处于顺从姿态的亚洲女性,这可能是训练数据中特定场景过度代表的结果。
尽管存在偏见问题,人们可能会认为Unstable Diffusion的技术突破会导致该团体加倍努力生成AI色情内容。但令人惊讶的是,情况并非如此。
虽然Unstable Diffusion的创始人仍然致力于生成式AI无限制的理念,但他们正在寻求采用更为大众市场接受的信息和品牌。现在有五名全职员工的团队正在努力将Unstable Diffusion转变为软件即服务的业务,通过销售网站订阅来资助产品改进和客户支持。
“我们很幸运有一个非常支持我们的用户社区。不过,我们认识到,要将Unstable Diffusion提升到一个新的水平,我们将受益于战略合作伙伴和额外的投资,”Chaudhry说。“我们希望确保为我们的订户提供价值,同时也保持我们平台对那些刚刚接触AI艺术世界的人的可访问性。”
为了在自由内容政策之外脱颖而出,Unstable Diffusion非常重视定制化。用户可以更改生成图像的调色板,Chaudhry指出,还可以选择包括“数字艺术”、“照片”、“动漫”和“通用”在内的一系列艺术风格。
“我们专注于确保我们的系统可以从最简单的提示词生成美丽且令人愉悦的图像,使我们的平台对新手和有经验的用户都易于使用,”Chaudry说。“[我们的系统]赋予用户引导图像生成过程的权力。”
在其他方面,为了追求主流投资者和客户的推动,Unstable Diffusion声称已经投入了大量资源创建“健全”的内容审核系统。
但你可能会说,内容审核与Unstable Diffusion的使命背道而驰?显然不是。Unstable Diffusion确实在一些可能让其陷入法律困境的图像上划定了界限,包括名人的色情深伪图像和描绘看起来像18岁或以下角色的色情内容——无论是虚构的还是非虚构的。
例如,美国多个州都有反对深伪色情的法律,而且国会至少有一项努力试图在美国将分享未经同意生成的AI色情内容定为非法。
除了屏蔽特定词语和短语外,Unstable Diffusion的审核系统还利用一个AI模型,试图识别并自动删除违反其政策的图像。Chaudhry表示,过滤器目前设置为“高度敏感”,谨慎行事,但Unstable Diffusion正在从社区征求反馈,以“找到合适的平衡点”。
“我们优先考虑用户的安全,并致力于使我们的平台成为一个可以不必担心不适当内容干扰创造力的蓬勃发展空间,”Chaudhry说。“我们希望我们的用户在使用我们的平台时感到安全和安心,并且我们致力于维护一个尊重这些价值观的环境。”
尽管如此,深伪过滤器似乎并不那么严格。我尝试使用Unstable Diffusion生成了几位名人的裸体图像(“Chris Hemsworth”,“Donald Trump”),没出现任何问题(除了那些特别写实或准确的图像,比如性别转换后的唐纳德·特朗普外)。
在本文发表后,Unstable Diffusion表示其过滤系统中发现了一个“漏洞”,该漏洞允许生成违反使用政策的内容。据称,该漏洞现已修复,并添加了统计监控到其过滤系统中,“以便如果问题再次发生,可以更早地发现。”
“Unstable Diffusion一直以打击深伪而闻名,并且由于我们的反深伪政策,拒绝了无数的资金和合作机会,”一位发言人通过电子邮件表示。“我们非常致力于打击深伪,并在解决问题时立即禁用了我们的网站。现在它已经重新上线,我们已经测试了文章中的名人,他们都被适当地禁止了。”
假设Unstable Diffusion获得了它所寻求的投资,它计划加强计算基础设施——这是一个持续的挑战,因为其社区规模不断增长。(使用该网站后,我可以证明其负载沉重——图像通常需要大约一分钟生成。)它还计划构建更多的定制选项和社交分享功能,利用Discord服务器作为跳板。
“我们希望将我们积极互动的社区从Discord过渡到我们的网站,鼓励用户分享、合作和相互学习,”Chaudhry说。“我们的社区是我们的核心优势——我们计划将其与我们的服务集成,并为他们提供工具,使其扩展和成功。”
但我难以确定Unstable Diffusion的“成功”是什么样子。一方面,该团体希望被视为一个严肃的生成艺术平台。另一方面,正如Discord服务器所展示的那样,它仍然是色情内容的发源地——其中一些内容相当令人不快。
以目前的平台存在形式来看,传统的风险投资资金是不可能的。 “副条款”禁止机构资金投资于色情业务,而是通过基金经理秘密设立的“附属”基金来进行投资。
即使它放弃了成人内容,Unstable Diffusion也不得不面对生成AI领域的一个大问题:艺术家的同意和补偿。像大多数生成AI艺术模型一样,Unstable Diffusion的模型是通过网络上的艺术作品进行训练的,这些作品不一定是得到创作者许可的。许多艺术家对此表示反对,并且实际上已经因AI系统模仿他们的风格而提起诉讼,认为这些系统没有给予应有的信用或报酬。
兽设艺术社区FurAffinity决定完全禁止AI生成的SFW和NSWF艺术作品,Newgrounds也采取了类似的措施。直到最近,Reddit才撤销部分对AI生成的色情内容的禁令,并且表示该平台上的艺术作品必须描绘虚构人物。
在此前接受TechCrunch的采访中,Chaudhry表示,Unstable Diffusion将考虑让其模型“对艺术社区更加公平”的方法。但据我所知,这方面还没有任何进展。
事实上,就像围绕AI生成色情内容的伦理问题一样,Unstable Diffusion的情况似乎短期内无法得到解决。该团队似乎注定要处于停滞状态,一边试图通过自我提升来维持运营,一边避免争议,避免疏远让其成功的社区和艺术家。