pixel alchemy studio

其他资源 2025-08-15

Pixelalchemy Studio?

Pixelalchemy Studio是一个由Python和Pygame构建的交互式2D绘图应用程序,并具有Google的Gemini和Weo API的生成AI功能。素描您的想法,通过AI驱动的图像生成来完善它们,并通过视频动画使它们栩栩如生!

202505241459.1.mp4

?功能

直观的绘图工具:

  • 像素完美的图形
  • 线图:DDA和Bresenham算法
  • 圆形绘图:布雷森汉姆的算法
  • 椭圆图:中点算法
  • 立方贝齐尔曲线
  • 基本形状:三角形,矩形
  • 多点多边形

AI驱动的图像生成和编辑(双子座):

  • 提供文本提示以生成图像或修改现有画布内容
  • 使用Google的Gemini-2.0-Flash-Exp模型(可配置)
  • 智能及时提高样式一致性(“保持相同的最小线涂鸦样式”)

AI驱动的视频动画(VEO):

  • 使用固定的提示为当前的画布图像进行动画:“动画保持样式保持相同的最小线涂鸦样式。”
  • 使用Google的VEO-2.0生成-001型号(可配置)
  • 具有屏幕状态更新和轮询的异步操作处理
  • 生成的视频作为MP4文件在本地保存

用户友好的界面:

  • 清除帆布功能
  • 可选的图纸颜色
  • 用于工具和颜色的专用控制面板
  • AI操作反馈的状态栏
  • 键盘快捷键,用于快速工具访问

技术堆栈

  • Python 3.11+
  • Pygame :用于图形,UI和事件处理
  • Google Generative AI SDK (Google-genai):与Gemini&Veo API互动
  • 枕头(PIL) :用于图像操纵和处理
  • 紫外线:用于快速项目和虚拟环境管理
  • Python-dotenv :用于通过.env文件管理API键

项目结构

该项目的组织如下:

pixel-alchemy-studio/
├── .env.example         # Example environment file
├── pyproject.toml       # Project metadata and dependencies for UV
├── README.md            # This file
├── run.py               # Script to easily run the application
├── src/
│   └── graficador/
│       ├── algorithms/  # Drawing algorithms (Bresenham, DDA, Bezier, etc.)
│       ├── geometry/    # Geometric primitives (e.g., Point)
│       ├── ui/          # UI components (Button, Canvas, Controls)
│       ├── app.py       # Main application class, event handling, AI integration
│       ├── config.py    # Configuration (screen size, colors, API models)
│       └── main.py      # Entry point of the application
├── assets/              # (Optional) For static assets like icons, fonts
├── docs/                # (Optional) For extended documentation, demo GIFs
├── tests/               # Test files
└── uv.lock              # UV lock file

设置和安装

请按照以下步骤在本地计算机上启动并运行Pixelalchemy Studio。

先决条件

  • Python 3.11或更高
  • 紫外线:安装在系统上。如果没有,请按照UV的官方网站上的安装说明进行操作

安装步骤

  1. 克隆存储库:

    git clone https://*g*ithub*.com/josefdc/pixel-alchemy-studio.git
    cd pixel-alchemy-studio
  2. 使用UV创建和激活虚拟环境:

    uv venv
    source .venv/bin/activate  # On Linux/macOS
    # .venv\Scripts\activate   # On Windows
  3. 使用UV和pyproject.toml安装依赖项:

    确保您的pyproject.toml文件具有[project.ipentencies]下列出的必要依赖项。

    pyproject.toml的示例(确保您的项目的需求符合您的需求):

    [ project ]
    name = " pixel_alchemy_studio " 
    version = " 0.1.0 "
    description = " Interactive drawing with AI-powered image and video generation. "
    requires-python = " >=3.11 "
    dependencies = [
        " pygame>=2.5.0 " ,
        " google-genai>=1.10.0 " , # Check for the latest Veo-compatible version
        " Pillow>=10.0.0 " ,
        " python-dotenv>=1.0.0 "
    ]
    
    [ build-system ]
    requires = [ " hatchling " ]
    build-backend = " hatchling.build "

    然后使用以下方式安装依赖项:

    uv pip sync
  4. 设置Google API密钥:

    • 去Google AI Studio获取您的API密钥
    • 确保在Google Cloud Project中启用了生成语言API(用于Gemini)和顶点AI API(为项目启用VEO模型访问)
    • 对于VEO :VEO是一项付费功能。确保在与API密钥关联的Google云项目上启用计费
    • 在项目的根目录中创建一个名为.env的文件(Pixel-Alchemy-Studio/.env)
    • 将您的API键添加到这样的.ENV文件中:
      GOOGLE_API_KEY="YOUR_ACTUAL_API_KEY_HERE"
      
    • (一个.env.example文件应在您的存储库中作为模板提供)

如何运行

设置完成后,请从项目的根目录中运行应用程序:

uv run python -m src.graficador.main

?如何使用

  • 主接口:应用程序窗口分为左侧的图形画布,右侧为一个控制面板。

  • 选择工具:单击控制面板中的按钮以选择绘图工具或AI功能。键盘快捷键也可用(按钮指示)。

  • 绘画

    • 像素(P) :单击并拖动绘制徒手
    • 线(L,B),圆圈(O),椭圆(E) :单击第一个点(例如,线开始,圆/椭圆的中心),然后单击第二点(例如,线的末端,radius/gende上的点,点上的点)
    • Bézier曲线(Z) :单击四次以定义两个端点和两个控制点
    • 三角形(T) :单击三次以获取顶点
    • 矩形(R) :单击两个相对角的两次
    • 多边形(y) :单击每个顶点。单击第一个顶点附近(阈值之内)以关闭多边形
  • 选择颜色:单击控制面板中的颜色色板。

  • 清除画布(C) :单击“清除”按钮或按'c'。这也重置AI指出。

  • 双子座 - 图像生成/编辑(G)

    • 按'g'或单击“使用AI生成”按钮。状态栏将提示您输入
    • 键入所需的修改或发电提示(例如,“戴着帽子的猫”,“使蓝色”)
    • 按Enter。双子座将在您的提示下处理当前的帆布图像
    • 画布将使用AI生成的图像进行更新
  • VEO-视频动画(V)

    • 确保画布上有图纸
    • 按'v'或单击“用veo视频”按钮
    • 该应用程序将使用当前的帆布图像和固定的内部提示(“动画保持样式保持相同的最小生产线样式。”)以生成视频
    • 监视状态栏的进度(初始化→生成→轮询→完成/错误)
    • 生成的视频(MP4)保存在项目的根目录中(例如,weo_video_12345_0.mp4)
    • 注意:视频生成可能需要几分钟。在投票期间,UI将保持响应
  • 退出:在其运行的终端中关闭Pygame窗口或按CTRL+C。

配置

可以在以下位置调整高级参数,例如FPS,默认颜色,API模型名称和VEO生成设置(默认的宽高比,持续时间)。

?潜在的未来增强功能

  • 高级彩色选择器和定制调色板
  • 图像导入/导出选项
  • 层管理系统
  • 撤消/重做功能
  • 更复杂的刷子/绘图工具
  • UI控件的VEO参数(提示,持续时间,纵横比)
  • 应用内视频播放
  • 使用绘制口罩的双子座涂上/支出

致谢和灵感

该项目的灵感来自其他AI驱动的绘图应用程序中展示的创造性可能性。特别感谢并致谢:

特鲁迪(Trudy)在拥抱面孔空间上的“双子座共同绘画” :该项目是探索协作和Ai-heancanced绘图的最初灵感。您可以在这里找到它:Trudy/Gemini-codrawing。

?许可证

该项目是根据Apache许可证2.0许可的。有关更多详细信息,请参见许可证文件。

与Pixelalchemy Studio一起开心的素描和炼金术!

下载源码

通过命令行克隆项目:

git clone https://github.com/josefdc/pixel-alchemy-studio.git