admin管理员组文章数量:1487745
四步快速配置一个简单高效的文本生成图像基准模型DF
本文将介绍一个简单高效的文本生成图像基准模型,该基准模型是DF-GAN20版代码,清楚简单,实用性高,本基准模型代码在他的基础上经过少量简化和处理,虚拟环境也进行了打包,非常适合作为一个基线模型,然后在其上进行对应创新。
一、下载代码
代码地址:.git
下载方法:git clone .git
或者进入github下载压缩包并解压:
下载后的代码结构如下:
其中:code文件夹放置模型主要代码,data放置数据集(如bird、coco),DAMSMencoders放置已经训练好的文本编码器和图像编码器。
二、配置虚拟环境
点击下载已经打包好的虚拟环境(github上有提供),将其放到Anaconda安装目录下的envs中,无需解压。比如D:\Anaconda3\envs:
放入之后可以在anaconda prompt或者pycharm终端中输入:conda info --envs
,如果显示有demoEnv则成功导入虚拟环境:
三、配置数据集
数据集已经打包上传至OneDrive,下载CUB数据集,替换代码项目的data文件夹:
四、开始运行
最终配置好的项目结构如下:
其中code/cfg里的yml文件存放模型的一些参数,code/miscc文件夹存放模型的选项和工具函数,DAMSM是深度注意多模态相似模块,dataset用于处理数据和加载dataloader,main是项目的入口文件,model是模型文件。
运行:
1、激活demoEnv环境:conda activate demoEnv
2、进入code目录,开始运行,模型进入训练:python main.py --cfg cfg/bird.yml
3、训练好了之后,将code/cfg/bird.yml中的B_VALIDATION 改为True,然后进入采样:python main.py --cfg cfg/bird.yml
本文标签: 四步快速配置一个简单高效的文本生成图像基准模型DF
版权声明:本文标题:四步快速配置一个简单高效的文本生成图像基准模型DF 内容由网友自发贡献,该文观点仅代表作者本人, 转载请联系作者并注明出处:http://www.betaflare.com/shuma/1755014657a3182485.html, 本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。
发表评论