大家好,最近对大语言模型基础及应用做了一个系列相关主题的介绍,主要介绍了transformer架构,包括编码器架构及应用(BERT),解码器架构及应用(GPT),以及编码器解码器架构(seq2seq任务)等,同时对较新的大语言模型的架构(MoE)和算法(RLHF, GRPO)等做了介绍,希望能对相关同学们和从业人员有点帮助,谢谢。
References
大家好,最近对大语言模型基础及应用做了一个系列相关主题的介绍,主要介绍了transformer架构,包括编码器架构及应用(BERT),解码器架构及应用(GPT),以及编码器解码器架构(seq2seq任务)等,同时对较新的大语言模型的架构(MoE)和算法(RLHF, GRPO)等做了介绍,希望能对相关同学们和从业人员有点帮助,谢谢。
References
by
Tags:
Leave a Reply