Page 33 - 金融科技视界2023-1期
P. 33

Technical Tracking
                                                                                                  技术追踪




            学应用题,尽管它可以写出一长串计算过程,但最后答案却是错                                          当然,瑕不掩 瑜,有工程 师贴
            误的。                                                               出了要求ChatGPT写verilog代码
                2)ChatGPT无法处理复杂冗长或者特别专业的语言结                                   (芯片设计代码)的对话。可以看出
            构。对于来自金融、自然科学或医学等非常专业领域的问题,如                                      ChatGPT水平已经超出一些verilog

            果没有进行足够的语料“喂食”,ChatGPT可能无法生成适当的                                   初学者了。
            回答。
                3)ChatGPT需要非常大量的算力(芯片)来支持其训练和
                                                                                             5
            部署。抛开需要大量语料数据训练模型不说,在目前,ChatGPT
            在应用时仍然需要大算力的服务器支持,而这些服务器的成本是                                        ChatGPT的未来改进方向
            普通用户无法承受的,即便数十亿个参数的模型也需要惊人数量
            的计算资源才能运行和训练。,如果面向真实搜索引擎的数以亿                                          5.1 减少人类反馈的RLAIF
            记的用户请求,如采取目前通行的免费策略,任何企业都难以承                                          2020年底,OpenAI前研究副

            受这一成本。因此对于普通大众来说,还需等待更轻量型的模型                                      总裁Dario Amodei带着10名员工创
            或更高性价比的算力平台。                                                      办了一个人工智能公司Anthropic。
                4)ChatGPT还没法在线的把新知识纳入其中,而出现一                                  Anthropic的创始团队成员,大多为

            些新知识就去重新预训练GPT模型也是不现实的,无论是训练                                      OpenAI的早期及核心员工,参与过
            时间或训练成本,都是普通训练者难以接受的。如果对于新知                                       OpenAI的GPT-3、多模态神经元、
            识采取在线训练的模式,看上去可行且语料成本相对较低,但                                       人类偏好的强化学习等。
            是很容易由于新数据的引入而导致对原有知识的灾难性遗忘的                                           2 0 2 2 年1 2 月,A n t h r o p i c
            问题。                                                               再次 发表论文《Con stitution a l

                5)ChatGPT仍然是黑盒模型。目前还未能对ChatGPT的内                              A I :H a r m l es s n es s   f r o m
            在算法逻辑进行分解,因此并不能保证ChatGPT不会产生攻击甚                                   A I   F e e dba c k 》介 绍 人 工 智
            至伤害用户的表述。                                                         能模型 C l a u d e 。(a r x i v. o r g /






























              CAI模型训练过程

                                                                                        2023.1  金融科技视界     31
   28   29   30   31   32   33   34   35   36   37   38