depot/third_party/nixpkgs/pkgs/development/python-modules/scrapy/default.nix

{
  lib,
  stdenv,
  botocore,
  buildPythonPackage,
  cryptography,
  cssselect,
  defusedxml,
  fetchFromGitHub,
  glibcLocales,
  installShellFiles,
  itemadapter,
  itemloaders,
  jmespath,
  lxml,
  packaging,
  parsel,
  pexpect,
  protego,
  pydispatcher,
  pyopenssl,
  pytestCheckHook,
  pythonOlder,
  queuelib,
  service-identity,
  setuptools,
  sybil,
  testfixtures,
  tldextract,
  twisted,
  uvloop,
  w3lib,
  zope-interface,
}:

buildPythonPackage rec {
  pname = "scrapy";
  version = "2.11.2";
  pyproject = true;

  disabled = pythonOlder "3.8";

  src = fetchFromGitHub {
    owner = "scrapy";
    repo = "scrapy";
    rev = "refs/tags/${version}";
    hash = "sha256-EaO1kQ3VSTwEW+r0kSKycOxHNTPwwCVjch1ZBrTU0qQ=";
  };


  nativeBuildInputs = [
    installShellFiles
    setuptools
  ];

  propagatedBuildInputs = [
    cryptography
    cssselect
    defusedxml
    itemadapter
    itemloaders
    lxml
    packaging
    parsel
    protego
    pydispatcher
    pyopenssl
    queuelib
    service-identity
    tldextract
    twisted
    w3lib
    zope-interface
  ];

  nativeCheckInputs = [
    botocore
    glibcLocales
    jmespath
    pexpect
    pytestCheckHook
    sybil
    testfixtures
    uvloop
  ];

  LC_ALL = "en_US.UTF-8";

  disabledTestPaths = [
    "tests/test_proxy_connect.py"
    "tests/test_utils_display.py"
    "tests/test_command_check.py"
    # Don't test the documentation
    "docs"
  ];

  disabledTests =
    [
      # Requires network access
      "AnonymousFTPTestCase"
      "FTPFeedStorageTest"
      "FeedExportTest"
      "test_custom_asyncio_loop_enabled_true"
      "test_custom_loop_asyncio"
      "test_custom_loop_asyncio_deferred_signal"
      "FileFeedStoragePreFeedOptionsTest" # https://github.com/scrapy/scrapy/issues/5157
      "test_persist"
      "test_timeout_download_from_spider_nodata_rcvd"
      "test_timeout_download_from_spider_server_hangs"
      "test_unbounded_response"
      "CookiesMiddlewareTest"
      # Test fails on Hydra
      "test_start_requests_laziness"
    ]
    ++ lib.optionals stdenv.isDarwin [
      "test_xmliter_encoding"
      "test_download"
      "test_reactor_default_twisted_reactor_select"
      "URIParamsSettingTest"
      "URIParamsFeedOptionTest"
      # flaky on darwin-aarch64
      "test_fixed_delay"
      "test_start_requests_laziness"
    ];

  postInstall = ''
    installManPage extras/scrapy.1
    installShellCompletion --cmd scrapy \
      --zsh extras/scrapy_zsh_completion \
      --bash extras/scrapy_bash_completion
  '';

  pythonImportsCheck = [ "scrapy" ];

  __darwinAllowLocalNetworking = true;

  meta = with lib; {
    description = "High-level web crawling and web scraping framework";
    mainProgram = "scrapy";
    longDescription = ''
      Scrapy is a fast high-level web crawling and web scraping framework, used to crawl
      websites and extract structured data from their pages. It can be used for a wide
      range of purposes, from data mining to monitoring and automated testing.
    '';
    homepage = "https://scrapy.org/";
    changelog = "https://github.com/scrapy/scrapy/raw/${version}/docs/news.rst";
    license = licenses.bsd3;
    maintainers = with maintainers; [ vinnymeller ];
  };
}
Project import generated by Copybara. GitOrigin-RevId: e8057b67ebf307f01bdcc8fba94d94f75039d1f6 2024-06-05 15:53:02 +00:00			`{`
			`lib,`
			`stdenv,`
			`botocore,`
			`buildPythonPackage,`
			`cryptography,`
			`cssselect,`
			`defusedxml,`
			`fetchFromGitHub,`
			`glibcLocales,`
			`installShellFiles,`
			`itemadapter,`
			`itemloaders,`
			`jmespath,`
			`lxml,`
			`packaging,`
			`parsel,`
			`pexpect,`
			`protego,`
			`pydispatcher,`
			`pyopenssl,`
			`pytestCheckHook,`
			`pythonOlder,`
			`queuelib,`
			`service-identity,`
			`setuptools,`
			`sybil,`
			`testfixtures,`
			`tldextract,`
			`twisted,`
			`uvloop,`
			`w3lib,`
			`zope-interface,`
Project import generated by Copybara. GitOrigin-RevId: 2c3273caa153ee8eb5786bc8141b85b859e7efd7 2020-04-24 23:36:52 +00:00			`}:`

			`buildPythonPackage rec {`
Project import generated by Copybara. GitOrigin-RevId: 3a8d7958a610cd3fec3a6f424480f91a1b259185 2021-06-28 23:13:55 +00:00			`pname = "scrapy";`
Project import generated by Copybara. GitOrigin-RevId: e8057b67ebf307f01bdcc8fba94d94f75039d1f6 2024-06-05 15:53:02 +00:00			`version = "2.11.2";`
Project import generated by Copybara. GitOrigin-RevId: 1536926ef5621b09bba54035ae2bb6d806d72ac8 2024-02-29 20:09:43 +00:00			`pyproject = true;`
Project import generated by Copybara. GitOrigin-RevId: 48037fd90426e44e4bf03e6479e88a11453b9b66 2022-05-18 14:49:53 +00:00
Project import generated by Copybara. GitOrigin-RevId: f99e5f03cc0aa231ab5950a15ed02afec45ed51a 2023-10-09 19:29:22 +00:00			`disabled = pythonOlder "3.8";`
Project import generated by Copybara. GitOrigin-RevId: 2c3273caa153ee8eb5786bc8141b85b859e7efd7 2020-04-24 23:36:52 +00:00
Project import generated by Copybara. GitOrigin-RevId: e8057b67ebf307f01bdcc8fba94d94f75039d1f6 2024-06-05 15:53:02 +00:00			`src = fetchFromGitHub {`
			`owner = "scrapy";`
			`repo = "scrapy";`
			`rev = "refs/tags/${version}";`
			`hash = "sha256-EaO1kQ3VSTwEW+r0kSKycOxHNTPwwCVjch1ZBrTU0qQ=";`
Project import generated by Copybara. GitOrigin-RevId: 3a8d7958a610cd3fec3a6f424480f91a1b259185 2021-06-28 23:13:55 +00:00			`};`
Project import generated by Copybara. GitOrigin-RevId: 2c3273caa153ee8eb5786bc8141b85b859e7efd7 2020-04-24 23:36:52 +00:00
Project import generated by Copybara. GitOrigin-RevId: 33d1e753c82ffc557b4a585c77de43d4c922ebb5 2024-05-15 15:35:15 +00:00
Project import generated by Copybara. GitOrigin-RevId: 3a8d7958a610cd3fec3a6f424480f91a1b259185 2021-06-28 23:13:55 +00:00			`nativeBuildInputs = [`
			`installShellFiles`
Project import generated by Copybara. GitOrigin-RevId: 1536926ef5621b09bba54035ae2bb6d806d72ac8 2024-02-29 20:09:43 +00:00			`setuptools`
Project import generated by Copybara. GitOrigin-RevId: 2c3273caa153ee8eb5786bc8141b85b859e7efd7 2020-04-24 23:36:52 +00:00			`];`

			`propagatedBuildInputs = [`
			`cryptography`
			`cssselect`
Project import generated by Copybara. GitOrigin-RevId: e8057b67ebf307f01bdcc8fba94d94f75039d1f6 2024-06-05 15:53:02 +00:00			`defusedxml`
Project import generated by Copybara. GitOrigin-RevId: 3a8d7958a610cd3fec3a6f424480f91a1b259185 2021-06-28 23:13:55 +00:00			`itemadapter`
			`itemloaders`
Project import generated by Copybara. GitOrigin-RevId: 2c3273caa153ee8eb5786bc8141b85b859e7efd7 2020-04-24 23:36:52 +00:00			`lxml`
Project import generated by Copybara. GitOrigin-RevId: 412b9917cea092f3d39f9cd5dead4effd5bc4053 2022-10-30 15:09:59 +00:00			`packaging`
Project import generated by Copybara. GitOrigin-RevId: 2c3273caa153ee8eb5786bc8141b85b859e7efd7 2020-04-24 23:36:52 +00:00			`parsel`
Project import generated by Copybara. GitOrigin-RevId: 3a8d7958a610cd3fec3a6f424480f91a1b259185 2021-06-28 23:13:55 +00:00			`protego`
Project import generated by Copybara. GitOrigin-RevId: 2c3273caa153ee8eb5786bc8141b85b859e7efd7 2020-04-24 23:36:52 +00:00			`pydispatcher`
			`pyopenssl`
			`queuelib`
			`service-identity`
Project import generated by Copybara. GitOrigin-RevId: 710fed5a2483f945b14f4a58af2cd3676b42d8c8 2022-03-30 09:31:56 +00:00			`tldextract`
Project import generated by Copybara. GitOrigin-RevId: 3a8d7958a610cd3fec3a6f424480f91a1b259185 2021-06-28 23:13:55 +00:00			`twisted`
Project import generated by Copybara. GitOrigin-RevId: 2c3273caa153ee8eb5786bc8141b85b859e7efd7 2020-04-24 23:36:52 +00:00			`w3lib`
Project import generated by Copybara. GitOrigin-RevId: 9b19f5e77dd906cb52dade0b7bd280339d2a1f3d 2024-01-13 08:15:51 +00:00			`zope-interface`
Project import generated by Copybara. GitOrigin-RevId: 3a8d7958a610cd3fec3a6f424480f91a1b259185 2021-06-28 23:13:55 +00:00			`];`

Project import generated by Copybara. GitOrigin-RevId: a100acd7bbf105915b0004427802286c37738fef 2023-02-02 18:25:31 +00:00			`nativeCheckInputs = [`
Project import generated by Copybara. GitOrigin-RevId: 3a8d7958a610cd3fec3a6f424480f91a1b259185 2021-06-28 23:13:55 +00:00			`botocore`
			`glibcLocales`
			`jmespath`
Project import generated by Copybara. GitOrigin-RevId: c757e9bd77b16ca2e03c89bf8bc9ecb28e0c06ad 2023-11-16 04:20:00 +00:00			`pexpect`
Project import generated by Copybara. GitOrigin-RevId: 3a8d7958a610cd3fec3a6f424480f91a1b259185 2021-06-28 23:13:55 +00:00			`pytestCheckHook`
			`sybil`
			`testfixtures`
Project import generated by Copybara. GitOrigin-RevId: e8057b67ebf307f01bdcc8fba94d94f75039d1f6 2024-06-05 15:53:02 +00:00			`uvloop`
Project import generated by Copybara. GitOrigin-RevId: 3a8d7958a610cd3fec3a6f424480f91a1b259185 2021-06-28 23:13:55 +00:00			`];`

Project import generated by Copybara. GitOrigin-RevId: 2c3273caa153ee8eb5786bc8141b85b859e7efd7 2020-04-24 23:36:52 +00:00			`LC_ALL = "en_US.UTF-8";`

Project import generated by Copybara. GitOrigin-RevId: 3a8d7958a610cd3fec3a6f424480f91a1b259185 2021-06-28 23:13:55 +00:00			`disabledTestPaths = [`
			`"tests/test_proxy_connect.py"`
			`"tests/test_utils_display.py"`
			`"tests/test_command_check.py"`
			`# Don't test the documentation`
			`"docs"`
Project import generated by Copybara. GitOrigin-RevId: 8133b9cb5f7c00d4fe31c8c2c4b525bc2650bfc0 2020-10-16 20:44:37 +00:00			`];`

Project import generated by Copybara. GitOrigin-RevId: e8057b67ebf307f01bdcc8fba94d94f75039d1f6 2024-06-05 15:53:02 +00:00			`disabledTests =`
			`[`
			`# Requires network access`
			`"AnonymousFTPTestCase"`
			`"FTPFeedStorageTest"`
			`"FeedExportTest"`
			`"test_custom_asyncio_loop_enabled_true"`
			`"test_custom_loop_asyncio"`
			`"test_custom_loop_asyncio_deferred_signal"`
			`"FileFeedStoragePreFeedOptionsTest" # https://github.com/scrapy/scrapy/issues/5157`
			`"test_persist"`
			`"test_timeout_download_from_spider_nodata_rcvd"`
			`"test_timeout_download_from_spider_server_hangs"`
			`"test_unbounded_response"`
			`"CookiesMiddlewareTest"`
			`# Test fails on Hydra`
			`"test_start_requests_laziness"`
			`]`
			`++ lib.optionals stdenv.isDarwin [`
			`"test_xmliter_encoding"`
			`"test_download"`
			`"test_reactor_default_twisted_reactor_select"`
			`"URIParamsSettingTest"`
			`"URIParamsFeedOptionTest"`
			`# flaky on darwin-aarch64`
			`"test_fixed_delay"`
			`"test_start_requests_laziness"`
			`];`
Project import generated by Copybara. GitOrigin-RevId: 8133b9cb5f7c00d4fe31c8c2c4b525bc2650bfc0 2020-10-16 20:44:37 +00:00
Project import generated by Copybara. GitOrigin-RevId: 2c3273caa153ee8eb5786bc8141b85b859e7efd7 2020-04-24 23:36:52 +00:00			`postInstall = ''`
Project import generated by Copybara. GitOrigin-RevId: 3a8d7958a610cd3fec3a6f424480f91a1b259185 2021-06-28 23:13:55 +00:00			`installManPage extras/scrapy.1`
Project import generated by Copybara. GitOrigin-RevId: 724bfc0892363087709bd3a5a1666296759154b1 2023-02-09 11:40:11 +00:00			`installShellCompletion --cmd scrapy \`
			`--zsh extras/scrapy_zsh_completion \`
			`--bash extras/scrapy_bash_completion`
Project import generated by Copybara. GitOrigin-RevId: 2c3273caa153ee8eb5786bc8141b85b859e7efd7 2020-04-24 23:36:52 +00:00			`'';`

Project import generated by Copybara. GitOrigin-RevId: e8057b67ebf307f01bdcc8fba94d94f75039d1f6 2024-06-05 15:53:02 +00:00			`pythonImportsCheck = [ "scrapy" ];`
Project import generated by Copybara. GitOrigin-RevId: 3a8d7958a610cd3fec3a6f424480f91a1b259185 2021-06-28 23:13:55 +00:00
Project import generated by Copybara. GitOrigin-RevId: b3616bd96400ce0252c241d76fcafb64389defc6 2021-01-15 22:18:51 +00:00			`__darwinAllowLocalNetworking = true;`

			`meta = with lib; {`
Project import generated by Copybara. GitOrigin-RevId: 3a8d7958a610cd3fec3a6f424480f91a1b259185 2021-06-28 23:13:55 +00:00			`description = "High-level web crawling and web scraping framework";`
Project import generated by Copybara. GitOrigin-RevId: 6143fc5eeb9c4f00163267708e26191d1e918932 2024-04-21 15:54:59 +00:00			`mainProgram = "scrapy";`
Project import generated by Copybara. GitOrigin-RevId: 3a8d7958a610cd3fec3a6f424480f91a1b259185 2021-06-28 23:13:55 +00:00			`longDescription = ''`
			`Scrapy is a fast high-level web crawling and web scraping framework, used to crawl`
			`websites and extract structured data from their pages. It can be used for a wide`
			`range of purposes, from data mining to monitoring and automated testing.`
			`'';`
Project import generated by Copybara. GitOrigin-RevId: 2c3273caa153ee8eb5786bc8141b85b859e7efd7 2020-04-24 23:36:52 +00:00			`homepage = "https://scrapy.org/";`
Project import generated by Copybara. GitOrigin-RevId: 9bf75dd50b7b6d3ce6aaf6563db95f41438b9bdb 2021-10-09 14:59:57 +00:00			`changelog = "https://github.com/scrapy/scrapy/raw/${version}/docs/news.rst";`
Project import generated by Copybara. GitOrigin-RevId: 2c3273caa153ee8eb5786bc8141b85b859e7efd7 2020-04-24 23:36:52 +00:00			`license = licenses.bsd3;`
Project import generated by Copybara. GitOrigin-RevId: 33d1e753c82ffc557b4a585c77de43d4c922ebb5 2024-05-15 15:35:15 +00:00			`maintainers = with maintainers; [ vinnymeller ];`
Project import generated by Copybara. GitOrigin-RevId: 2c3273caa153ee8eb5786bc8141b85b859e7efd7 2020-04-24 23:36:52 +00:00			`};`
			`}`